Защищая культуру Европы: Microsoft инвестирует в будущее языков и наследия в эпоху ИИ

Обложка

Microsoft делает серьезную ставку на сохранение языкового и культурного разнообразия Европы, а также на укрепление позиций континента в быстро меняющемся мире искусственного интеллекта. В Париже компания представила сразу две масштабные инициативы, призванные сделать европейское наследие более доступным в сети и обеспечить его достойное представление в больших языковых моделях (LLM).

Эти шаги продолжают более ранние Европейские цифровые обязательства, которые были направлены на развитие инфраструктуры ИИ и облачных технологий, усиление защиты данных, повышение кибербезопасности и поддержку конкурентоспособности Европы в цифровой сфере.

Европа – это дом для более чем 200 языков и тысячелетней истории, которые формируют культуру, творчество и экономику континента. Однако, в интернете сейчас доминирует английский язык, и зачастую – с американской перспективой. Это означает, что европейская культура и бизнес могут оказаться недостаточно представленными в тех данных, на которых обучаются современные языковые модели.

Брэд Смит, вице-председатель и президент Microsoft, подчеркивает: "Искусственный интеллект, не понимающий языки, историю и ценности Европы, не сможет в полной мере служить её народу, бизнесу и будущему".

Чтобы проиллюстрировать проблему, можно взглянуть на Llama 3.1 – модель с открытым исходным кодом. Её результаты на греческом языке на 15 баллов ниже, чем на английском, а на латышском – более чем на 25 баллов! При этом английский – на первом месте, греческий – в середине, а латышский – почти в конце списка. И такая картина наблюдается во многих тестах LLM.

European Digital Commitments

Как Microsoft планирует это исправить?

Для решения этой задачи Microsoft создает команду экспертов в своих инновационных центрах в Страсбурге (Франция). Они будут разрабатывать и курировать многоязычные наборы данных в Microsoft Azure. Эти специалисты из Открытого инновационного центра (MOIC) и лаборатории AI for Good будут сотрудничать с культурными учреждениями, университетами и технологическими компаниями по всей Европе. Их цель – расширить доступность обучающих данных на десяти европейских языках, которые сейчас недостаточно представлены в интернете. Среди них – эстонский, эльзасский, словацкий, греческий и мальтийский.

Кроме того, Microsoft объявила о приеме заявок на поиск цифровых текстов, транскриптов и других материалов, пригодных для обучения ИИ. Участники, прошедшие отбор, получат гранты в виде кредитов Azure, а также инженерную и техническую поддержку. Подробности можно будет узнать на сайте AI for Good Lab с 1 сентября 2025 года.

Цифровое перерождение собора Парижской Богоматери

Еще один важный проект – расширение программы Culture AI, в рамках которой будет создана сверхточная цифровая копия собора Парижской Богоматери. Этот проект, реализуемый в партнерстве с Министерством культуры Франции и компанией Iconem, специализирующейся на оцифровке наследия, позволит запечатлеть каждую деталь 862-летнего готического шедевра. Ранее Culture AI уже помогла сохранить в цифровом виде такие объекты, как Древняя Олимпия в Греции, гора Сен-Мишель во Франции, собор Святого Петра в Риме и места высадки союзников в Нормандии.

Microsoft подчеркивает, что эти инициативы опираются на более чем 40-летний опыт локализации. Сегодня Windows поддерживает более 90 языков, включая все официальные языки Европейского Союза, а также региональные языки, такие как баскский, каталанский, галисийский, люксембургский и валенсийский. Microsoft 365 также предлагает интерфейсы Office на более чем 30 европейских языках. Интегрируя европейские языки и культуру в свои платформы ИИ и облачных технологий, Microsoft стремится не только защитить наследие континента, но и расширить возможности его жителей и предприятий в цифровую эпоху.

Важно отметить, что компания подчеркивает исключительно поддерживающий характер этих шагов, предоставляя открытые данные, инструменты и знания, а не собственные разработки.

Мнение редакции MSReview: Microsoft делает важный шаг в направлении создания более инклюзивного и репрезентативного ИИ. Инвестиции в европейские языки и культуру помогут гарантировать, что технологии ИИ будут учитывать разнообразие и богатство европейского наследия, а также будут более полезными и релевантными для европейских пользователей.

MSReview Источник:
www.neowin.net
  • 0




  • Комментарии
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.