Штучний інтелект "дурніший" за немовля, але може отримати шкільний атестат

ШІ пройшов науковий тест для 8-го класу, але метод, який він застосовував, підкреслює відсутність у нього здорового глузду або чогось, що нагадувало б людську свідомість.

Дослідники штучного інтелекту давно мріяли побудувати комп’ютер настільки обізнаний та комунікативний, який міг би взаємодіяти з людьми природною (тобто людською) мовою.

Минулого тижня New York Times повідомила, що команда Інституту штучного інтелекту Аллена (AI2) досягла “нової віхи штучного інтелекту”. Машина, повідомляє Times, “готова до середньої школи. Можливо, навіть до інституту”. Про це пише Wired.

“Арісто” – це не перша система штучного інтелекту (ШІ), яка пройшла тест, розроблений для оцінки людських знань та здібностей. У 2015 році одна система здала тест IQ для чотирирічного віку, що стало причиною заголовку BBC: “ШІ має IQ чотирирічної дитини”. Інша група повідомила, що їх система може вирішувати питання геометрії SAT, а також тести для середнього американського учня 11-го класу.

Ai 5

Нещодавно дослідники Стенфорда створили тест, який спонукав New York Post оголосити, що “системи ШІ кращі за людей в розумінні прочитаного”. Але правда полягає в тому, що, хоча ці системи працюють добре на конкретних тестах, вони доцільні тільки в цьому конкретному тесті. Ніхто не наближається до того, щоб відповідати людям у розумінні прочитаного або інших загальних здібностях.

Проблема полягає в тому, що сьогоднішнім машинам, які переважають у певних вузьких завданнях, все ще бракує того, що ми можемо назвати здоровим глуздом. Сюди входить величезне, переважно несвідоме, фонове знання, яке ми використовуємо для розуміння ситуацій, з якими ми стикаємось, та мови, за допомогою якої ми спілкуємось. Здоровий глузд також включає нашу здатність швидко та гнучко застосовувати ці знання до нових обставин.

Мета наділення машин здоровим глуздом така ж стара, як і сфера самого ШІ. Починаючи з 90-х років, дослідження здорового глузду відійшли на місце статистичних, керованих даними ШІ підходів, особливо у формі нейронних мереж та “глибокого навчання”. Але останнім часом дослідники виявили, що системам глибокого навчання не вистачає надійності та загальності навчання людини, насамперед тому, що їм не вистачає наших широких знань та гнучких міркувань. Додати машині людського здорового глузду тепер знаходиться на вершині списку справ ШІ.

Розгорнуті відповіді на запитання все ще надто складні для сучасних систем ШІ, тому дослідники досягають прогресу, створюючи програми, які можуть добре працювати на “орієнтирах” – окремих наборах даних, які представляють конкретну задачу. Орієнтир “Арісто” складається з набору запитань із множинним вибором з іспиту з природничих наук у штаті Нью-Йорк.

Творці компанії Aristo вважають, що розробка систем ШІ для відповіді на подібні запитання є одним з найкращих способів просунутись вперед. “Хоча це не повний тест машинного інтелекту”, – зазначають вони, ці питання “вивчають кілька можливостей, тісно пов’язаних з інтелектом, включаючи розуміння мови, міркування та використання знань здорового глузду”.

Арісто – це складна система, яка поєднує кілька методів ШІ. Однак складовою, яка припадає на майже весь успіх системи, є глибока нейронна мережа, яка була навчена бути так званою мовною моделлю – механізм, який за умови послідовності слів може передбачити, яке слово буде наступним. “Я їхав занадто швидко, коли мене зупинила …”? Яке наступне слово? Можливо, це “грейпфрут”? Можливо, це “поліція”? Враховуючи послідовність слів, мовна модель обчислює ймовірність того, що кожне із сотень тисяч слів у своєму словнику буде наступним у послідовності.

Мовна модель Арісто була навчена послідовності слів із мільйонів документів (включаючи всю англійську Вікіпедію). Після навчання цій величезній колекції англійської мови нейронна мережа, ймовірно, дізналася деякі корисні речі про мову загалом. У цей момент мережу можна “налагодити”, щоб навчитися відповідати на запитання з різним вибором. Коли ШІ здає тест, його вхід – це питання плюс чотири можливі відповіді; вихід – це ймовірність правильності кожної відповіді. Мережа повертає відповідь з найбільшою ймовірністю як свою здогадку.

Ми повинні мати на увазі, що високий бал на певному наборі даних не завжди означає, що машина насправді вивчила завдання, які призначені її людськими програмістами.

Арісто був перевірений на 119 запитаннях з іспиту для восьмого класу і дав правильні відповіді на більш ніж 90% із них, неабиякий показник. Також правильних відповідей було у понад 83% запитань для випускного класу. У той час як Times повідомляло, що Арісто “пройшов тест”, команда AI2 відзначила, що фактичні тести, які здають студенти Нью-Йорка, містять питання, що посилаються на діаграми, а також питання “прямої відповіді”, з жодним з яких Арісто не впорався.

Це захоплюючий прогрес, але ми повинні мати на увазі, що високий бал на конкретному наборі даних не завжди означає, що машина насправді вивчила завдання. Адже є дані, що дозволяють системі працювати добре, не маючи реального розуміння чи міркувань.

Протягом останніх кількох років було опубліковано десятки робіт, які використовуються для оцінки систем машинного навчання. Це змусило деяких дослідників поставити під сумнів ступінь того, в яких системах глибокого навчання виявляється “справжнє розуміння”, а які просто реагують на поверхневі підказки даних.

Команда Aristo стверджувала, що їх питання орієнтованих на еталон, інтуїтивно вимагають міркування, щоб відповісти, і що відмінна ефективність Арісто “говорить про те, що машина справді щось дізналася про мову та як маніпулювати цими знаннями”.

Нам би, звичайно, хотілося б у це вірити, але коли Арісто додали чотири додаткові неправильні відповіді в кожне питання, продуктивність Aristo знизилася до менш ніж 60%.

Справжнє розуміння людської мови вимагає широких базових знань та розумових моделей, що дозволяють гнучко міркувати. Розробка систем з таким розумінням залишається найважчою проблемою в ШІ.

Без тестів і іншого окозамилювання, треба розуміти, що сьогодні не досягли створення справжньої свідомості. Наприклад, Американське агентство прогресивних науково-дослідних проектів у галузі оборони почало вливати гроші в дослідження машинного здорового глузду. Однією з проблем DARPA є розробка системи ШІ із здоровим глуздом 18-місячної дитини. Замість того, щоб бути готовим до середньої школи або коледжу, ШІ має багато зробити, перш ніж він хоча б буде готовий до дошкільного закладу.

До речі, китайська компанія Huawei веде переговори зі швейцарською ProtonMail на тему заміни поштового сервісу Gmail в своїх пристроях.

Нагадаємо, гнучкий смартфон Huawei може з’явитися на полицях крамниць вже наступного місяця. Про це йдеться у заяві глави споживчого бізнесу китайської технологічної компанії Річарда Ю (Richard Yu).

Також китайські кіберзлочинці націлилися на корпоративні VPN-сервери від Fortinet і Pulse Secure.

Стало відомо, Huawei готова надати іншим державам доступ до своїх вихідних кодів, для того щоб вони могли особисто переконатися у відсутності в них будь-яких бекдорів. Про це у вівторок, 3 вересня, заявив старший віце-президент компанії Джон Саффолк (John Suffolk) журналістам інформагентства Kyodo News.

Окрім цього, Apple визнала конструктивний недолік у деяких моделях Apple Watch, що може призвести до розтріскування екрана, і запустила програму заміни для постраждалих користувачів. Apple або уповноважені постачальники послуг безкоштовно замінять екран на відповідних моделях.

Twitter на невизначений термін відключила функцію Tweet via SMS, що дозволяє робити публікації в соціальній мережі через SMS-повідомлення. Причиною цього рішення став той факт, що кіберзлочинці скористалися Tweet via SMS для публікацій від імені як мінімум двох ключових фігур в Twitter.

Зверніть увагу, Ви можете повторно завантажувати будь-які додатки, які Ви купували або завантажували на свій iPhone або iPad раніше, Ви також можете завантажувати будь-які додатки, які придбали члени сім’ї, якщо Ви використовуєте функцію сімейного обміну від Apple.

Google випустила оновлення безпеки для своєї мобільної ОС Android, але не додала до нього патч як мінімум для однієї уразливості, що дозволяє підвищити привілеї до рівня ядра.

Cybercalm писав про те, як на смартфоні Аndroid можна записати розмову. Варто зауважимо, що вбудований функціонал із звукозапису бесіди присутній не у всіх версіях операційної системи. Як записувати розмови на останніх версіях Android, читайте у статті.