12 Jun 2025, 16:30
Бібліотеки відкривають фонди для навчання штучного інтелекту
- Великі бібліотечні фонди стають новим джерелом даних для розвитку алгоритмів штучного інтелекту.
- Оцифровані документи та книги з різних епох і мов забезпечують різноманітність навчальних матеріалів.
- Проєкти підтримують відкритість даних і враховують юридичні аспекти авторського права.
Про це повідомляють Associated Press, ABC News.
Технологічні компанії розширюють джерела даних для навчання штучного інтелекту, залучаючи бібліотечні колекції. Harvard University надала доступ до майже мільйона книг, виданих з XV століття 254 мовами, для досліджень у сфері штучного інтелекту. Також планується оцифрування старих газет і урядових документів, які зберігаються у Boston Public Library.
Колекція Harvard містить понад 394 мільйони відсканованих сторінок, включаючи твори з літератури, філософії, права та сільського господарства, більшість з яких припадає на XIX століття. Вона охоплює широкий спектр мов, серед яких англійська, німецька, французька, італійська, іспанська та латинь.
Підтримка проєкту здійснюється за рахунок внесків компаній Microsoft та OpenAI, а також співпраці з бібліотеками світу. Оцифровані матеріали стають відкритими для дослідників та громадськості через платформу Hugging Face.
Завдяки використанню книг із суспільного надбання зменшується ризик юридичних суперечок щодо авторського права. Проте у великих масивах даних можуть зустрічатися застарілі або некоректні відомості, тому розробники вживають заходів для зменшення потенційної шкоди від такого контенту.
Теги: Технології/ШІ