У гонці штучного інтелекту з’явився новий гравець — ціла країна. Швейцарія щойно представила Apertus, свою національну велику мовну модель (LLM) з відкритим вихідним кодом, яка має стати альтернативою рішенням від таких компаній, як OpenAI.
Apertus (з латинської — «відкритий») розробили три державні установи: Швейцарський федеральний технологічний інститут Лозанни (EPFL), ETH Цюрих та Швейцарський національний суперкомп’ютерний центр (CSCS).
«Наразі Apertus — провідна публічна ШІ-модель: модель, створена державними установами для суспільних потреб. Це найкращий доказ того, що ШІ може стати формою публічної інфраструктури — як автомагістралі, вода чи електрика», — заявив Джошуа Тан, провідний прихильник перетворення штучного інтелекту на суспільну інфраструктуру.
Повна відкритість і прозорість
Швейцарські установи створили Apertus повністю відкритою для дослідження. Користувачі можуть вивчити будь-яку частину процесу навчання моделі. Окрім самої моделі, розробники оприлюднили вичерпну документацію, вихідний код процесу навчання та використані набори даних.
Модель створена відповідно до швейцарського законодавства про захист даних та авторське право, що робить її привабливою для компаній, які прагнуть дотримуватися європейських норм. Швейцарська банківська асоціація раніше зазначала, що власна LLM матиме «великий довгостроковий потенціал», оскільки краще відповідатиме суворим місцевим вимогам щодо захисту даних та банківської таємниці.
Доступ для всіх
Новою моделлю може користуватися кожен: дослідники, ентузіасти та навіть компанії можуть адаптувати її під свої потреби. На базі Apertus можна створювати чат-боти, перекладачі, освітні та навчальні інструменти.
Багатомовність і етичне навчання
Модель навчали на 15 трильйонах токенів понад 1000 мовами, причому 40% даних — немовами, включно зі швейцарською німецькою та ретороманською. Швейцарія підкреслює, що модель навчали виключно на публічно доступних даних, а їхні веб-сканери поважали машинозчитувані запити на відмову від індексації.
Це контрастує з практиками деяких ШІ-компаній, які звинувачують у порушенні протоколів блокування сканерів та використанні контенту без дозволу правовласників.
Технічні характеристики
Apertus доступна у двох версіях: з 8 мільярдами та 70 мільярдами параметрів. Отримати доступ до моделі можна через швейцарську телекомунікаційну компанію Swisscom або платформу Hugging Face.


