Обучение мощных моделей искусственного интеллекта требует значительных ресурсов, включая высокопроизводительное оборудование и большие объемы данных, что влечет за собой значительные финансовые расходы. Сбор и подготовка обучающих датасетов часто требует обращения к поисковым системам, что является одним из наиболее затратных этапов.
Суть метода ZeroSearch заключается в том, что сбор необходимых данных для обучения новых моделей осуществляется с помощью уже существующих, хорошо обученных языковых моделей компании. Эти модели имитируют процесс поиска и сбора информации, но делают это внутренними ресурсами, исключая необходимость в сторонних API и внешней поисковой инфраструктуре.
Это приводит к значительной экономии. Например, обработка 64 000 запросов через стандартный поисковый API стоит около $586,70, в то время как использование внутренней модели ИИ с 14 миллиардами параметров для выполнения той же задачи обойдется всего в $70,80. Это означает, что затраты сокращаются более чем в восемь раз.
Разработчики уверены, что такая экономия сделает технологии ИИ более доступными для малых компаний и исследовательских групп с ограниченными финансовыми ресурсами. Alibaba уже активно использует гибридные методы, сочетая возможности своих моделей Qwen с традиционными поисковыми технологиями, что позволяет улучшить точность и релевантность ответов на сложные запросы пользователей.
Источник: www.gazeta.ru