Технологический гигант Nvidia приобрел компанию Gretel, специализирующуюся на создании синтетических данных, за сумму более 320 миллионов долларов. Эта сделка отражает растущую потребность индустрии искусственного интеллекта в качественных данных для обучения ИИ-моделей.
В условиях, когда компании, разрабатывающие генеративный ИИ, сталкиваются с нехваткой реальных данных для обучения своих систем, синтетические данные становятся все более привлекательной альтернативой. Технологии Gretel позволяют создавать искусственные наборы данных, которые можно использовать для тренировки ИИ-моделей без нарушения конфиденциальности и авторских прав.
Особую ценность синтетические данные представляют в таких чувствительных областях, как здравоохранение, где использование реальной информации о пациентах ограничено законами о защите персональных данных. Технология Gretel позволяет генерировать искусственные медицинские данные, сохраняющие статистические характеристики оригинальной информации, но не содержащие личных идентификаторов.
Однако эксперты предупреждают о рисках чрезмерной зависимости от синтетических данных. Модели, обученные исключительно на искусственной информации, могут давать менее точные результаты или даже полностью терять эффективность – явление, известное как "коллапс модели".
Приобретение Gretel усилит позиции Nvidia на рынке инструментов для разработчиков ИИ. Сотрудники Gretel войдут в команду Nvidia, что позволит интегрировать технологии синтетических данных в существующие продукты компании.