Компании, занимающиеся развитием искусственного интеллекта, столкнулись с нехваткой данных для обучения своих моделей. Об этом сообщил Илон Маск, отмечая, что теперь основное внимание уделяется использованию синтетических данных, передает RedMedia.kz.
Маск о развитии ИИ
В интервью, транслировавшемся на его платформе X, Маск подчеркнул, что объем доступной информации из интернета, использовавшийся для обучения моделей, исчерпан.
«Единственный способ компенсировать нехватку данных – это создавать синтетические материалы, которые позволят моделям учиться», – отметил он.
Синтетические данные и риски
Компании, такие как Meta, Microsoft и OpenAI, уже активно применяют синтетические данные – материалы, генерируемые самими ИИ, для настройки и обучения новых моделей. Однако Маск отметил, что этот процесс несет риски:
- ИИ может генерировать так называемые «галлюцинации» – неточные или бессмысленные ответы.
- Использование синтетических данных вызывает юридические и этические вопросы.
Что такое синтетические данные
Синтетические данные – это искусственно созданные материалы, которые имитируют реальные данные. Они помогают компенсировать недостаток обучающей информации и развивать возможности ИИ, такие как предсказание текста или анализ больших объемов информации.