Змови, любовні листи і рецепти: як розшифровують середньовічні таємниці

Сторінка зі стародавнім текстом

Автор фото, Beáta Megyesi

    • Author, Сандрін Серстемон
    • Role, BBC Future
  • Published
  • Час прочитання: 7 хв

В архівах Ватиканської бібліотеки понад 400 років залишалася непрочитаною загадкова рукописна книга, списана дивними символами. Її зашифровані сторінки, вочевидь, приховували секретні рецепти "від недуг людського тіла", як зазначено в написі на внутрішньому боці обкладинки. Такі лікувальні практики тоді тримали в таємниці, оскільки вони могли викликати підозри або навіть звинувачення у чаклунстві.

Відомий як шифр Борджа (Borg cipher), цей рукопис обсягом 408 сторінок здебільшого є незрозумілим - він закодований за допомогою 34 загадкових символів із додаванням кількох римських літер і титульної сторінки, написаної арабською мовою.

Жодного відомого ключа для його розшифрування не існувало. Деякі сторінки також пошкоджені через свій вік, що ще більше ускладнює читання коду.

Але за допомогою машинного навчання - однієї з форм штучного інтелекту - дослідникам вдалося розшифрувати цей код. Виявилося, що текст містить тисячі дивакуватих рецептів, як-от поради випити кілька склянок високоякісного червоного вина або ферментувати мускатний горіх у тісті, щоб боротися з дизентерією.

"Це схоже на детективне розслідування, де кожен символ, кожна закономірність і кожне часткове рішення можуть наблизити нас до чиїхось таємниць і до втраченого історичного світу", - каже Беата Меєші, професорка комп'ютерної лінгвістики Стокгольмського університету у Швеції, яка входила до команди, що розшифрувала текст.

Навіть із допомогою ШІ процес пошуку ключа до шифру був виснажливим.

Тепер Меєші та її колеги очолюють проєкт з використання можливостей ШІ для розшифрування історичних шифрів, що потенційно може відкрити величезний масив закодованої інформації з минулого, яку раніше не могли розгадати.

"Це відкриває захопливі можливості для рідкісних і нестандартних систем письма", - каже Беата Меєші.

За деякими оцінками, близько 1% матеріалів в архівах і бібліотеках у всьому світі повністю або частково зашифровані. Одні з найдавніших відомих шифрів датуються часами Стародавньої Греції та Риму.

Омана, мертві мови і поганий почерк

Пропустити Whatsapp і продовжити
BBC Україна тепер у WhatsApp!

Як дізнатися головне про Україну та світ?

Підписуйтеся на наш канал тут.

Кінець Whatsapp

Закодовані історичні документи приховують дипломатичну інформацію, ритуали таємних товариств, медичні знання, любовні історії або повсякденні деталі, які люди хотіли зберегти в таємниці. Це інформація, що наразі відсутня в історичних наративах.

У деяких випадках розшифрування таких документів може змінити наше уявлення про відому історичну постать або цілу епоху. Один із нещодавніх прикладів - колекція зашифрованих листів, які виявилися написаними Марією Стюарт під час її тривалого ув'язнення в Англії. Вони показали її участь у змовах із метою повернення трону та напружені стосунки з її сином Яковом VI Шотландським, майбутнім королем Англії Яковом I.

Історичні шифри можуть бути досить простими: наприклад, шифр Борджа використовує підстановочний шифр, тобто кожен символ був замінений однією римською літерою, щоб приховати зміст написаного. Однак інші можуть бути складнішими для розгадки.

У деяких випадках нічого не відомо про мову, якою був написаний оригінальний текст. Можуть також додаватися зайві, беззмістовні символи, щоб ввести в оману та збити зі сліду тих, хто намагається зрозуміти текст. В інших випадках одна й та сама літера може передаватися кількома різними знаками.

Це означає величезний обсяг роботи - часто методом спроб і помилок - навіть для розшифрування невеликої частини тексту.

Так, Сесіль П'єрро, криптологиня Французького національного інституту досліджень у галузі інформатики (INRIA) у Нансі, разом із колегами витратила шість місяців, щоб поступово розкрити ключ до 500‑річного листа Карла V, імператора Священної Римської імперії і короля Іспанії, написаного з використанням 120 різних символів шифру на трьох сторінках.

Розшифрований лист показав, що Карл V - один із наймогутніших людей свого часу - був охоплений страхом перед змовою з метою його вбивства. Король боявся, що італійський найманець, який служив французькому королю Франциску I, збирається його вбити.

Сторінка зі стародавнім текстом

Автор фото, Biblioteca Apostolica Vaticana

Підпис до фото, Шифр Борджа містить поєднання дивних шифрованих символів та латинського письма на 408 сторінках

Перш ніж почати розшифрування, дослідники мають ретельно перетворити рукописний шифр на цифровий документ, який можна завантажити в програмне забезпечення для дешифрування.

Поганий почерк і вицвітання чорнила ще більше ускладнюють це завдання. П'єрро каже, що їй зазвичай потрібен день, щоб переписати двосторінковий лист із незнайомими символами.

ШІ допомагає пришвидшити читання секретів

Але ШІ починає пришвидшувати процес. Мішель Вальдіспюль, професорка германської лінгвістики Університету Осло в Норвегії, разом із колегами нещодавно використала онлайн‑платформу ШІ Transkribus для транскрибування секретного листа, написаного дворянином Сигізмундом Гойзнером фон Вандерслебеном шведському лорд‑канцлеру Акселю Оксеншерні у 1637 році під час Тридцятирічної війни - релігійного конфлікту, що зрештою забрав мільйони життів і спустошив значні території Європи.

Цей інструмент навчений на різних мовах, письмових системах і почерках, що охоплюють кілька століть. Після завантаження зображення документа система визначає блоки тексту та окремі рядки, а потім сканує його символ за символом, перетворюючи на цифрову форму.

Хоча деякі виправлення довелося робити вручну, інструмент досить добре впорався з листом фон Вандерслебена, оскільки він був лише частково зашифрований числами, розділеними крапками й акуратно написаними. Інші частини не були закодовані й просто написані німецьким шрифтом XVII століття.

Наявні платформи ШІ для транскрибування часто мають труднощі, коли рукописи зашифровані незвичними символами, як‑от вигадані знаки, астрологічні символи або числа, записані дивним способом.

Однак Меєші, Вальдіспюль та їхні колеги розробляють власний інструмент ШІ, щоб перетворювати рукописні історичні тексти з незрозумілими символами або письмом на машинозчитувані документи в межах міжнародного проєкту Descrypt.

"Ми розробляємо більш адаптивні моделі, навчені та протестовані на широкому спектрі письмових систем, алфавітів і символічних наборів", - каже Меєші.

Чоловік іде повз полиці в архіві, фото зі спини

Автор фото, Getty Images

Підпис до фото, Багато архівів і бібліотек у всьому світі містять зашифровані тексти, які можуть містити цінну історичну інформацію

Щойно секретний документ транскрибують, починається детективна робота. Зараз криптологи часто використовують спеціально розроблене програмне забезпечення без ШІ, яке застосовує алгоритми для визначення типу шифру і його розкриття.

Прості шифри часто можна зламати шляхом аналізу частоти використання символів і зіставлення її з літерами алфавіту, які трапляються з такою ж частотою у мові. Наприклад, в англійській мові літера E є найпоширенішою, тоді як Z, Q і X - найрідкісніші.

Але в листі фон Вандерслебена з фронту Тридцятирічної війни, наприклад, для позначення літери E використовувалося до восьми різних символів. Це означало, що для поступового розкодування потрібні були як метод спроб і помилок, так і знання Вальдіспюль старонімецької мови.

"Це був постійний процес взаємодії між машиною та людиною‑перевіряльником, - каже Вальдіспюль. - Можливо, колись ШІ зможе робити це повністю самостійно".

За шифром ховалися попередження фон Вандерслебена про загрозу з боку фракцій протестантських союзників Швеції у війні. Він повідомив Оксеншерні, що був змушений відступити після отримання інформації про змову серед союзників, включно з лордом Францем Генріхом Саксонським.

Повторне відкриття кодів

Меєші та її команда нині досліджують, як ШІ може взагалі обійти етап транскрибування, просто аналізуючи фото сторінок для розшифрування секретних повідомлень. Нещодавно вони показали, що такий підхід може працювати для простих кодів, де кожну літеру замінює один символ.

Вони протестували систему на рукописі зі 105 сторінок, який уже був розшифрований і відомий як шифр Copiale, що описує ритуали, правила та ідеали німецького таємного товариства XVIII століття. Після навчання ШІ на загальному почерку, а потім на зображеннях рядків шифру та відповідного розшифрованого німецького тексту, система змогла точно розшифрувати частини тексту, яких раніше не бачила.

Такий підхід може бути особливо корисним, коли мова, що лежить в основі шифру, невідома.

"Це відкриває захопливі можливості для рідкісних і нестандартних систем письма, - каже Меєші. - Кінцева мета - поєднати транскрибування і дешифрування в один крок".

Глиняний диск із вирізьбленими символами

Автор фото, Getty Images

Підпис до фото, Символи на 4000‑річному Фестському диску, знайденому в руїнах мінойського палацу на Криті, залишаються значною мірою нерозшифрованими

Вальдіспюль і її колеги досліджують старі архіви в пошуках шифрованих текстів для створення бази даних. Це може бути вирішальним для накопичення достатнього обсягу даних для навчання ШІ, здатного розкривати коди. Великі мовні моделі, на яких ґрунтуються чатботи ШІ, такі як ChatGPT, навчаються на трильйонах слів із книг, статей і сайтів. Зібрати подібні обсяги даних для дешифрування складно.

Серед матеріалів, які вони зібрали, - 400 загадкових листівок, написаних шифром наприкінці 1800‑х - на початку 1900‑х років. Наразі розшифровані уривки показують, що частина з них є любовними листами, написаними німецькою мовою.

Команда Меєші використала свої напрацювання для створення інструменту ШІ у стилі чатбота, який поєднує транскрибування та дешифрування в одному кроці. Він об'єднує алгоритми дешифрування, навчені на парах символів шифру і відповідного тексту, із великими мовними моделями, навченими на історичних текстах різних періодів, щоб надавати підказки для розшифрування.

Також використовують алгоритми розпізнавання зображень, навчені на анотованому почерку. Інструмент ШІ зможе вдосконалюватися, враховуючи виправлення експертів.

Ідея полягає в тому, що дослідники або навіть широке коло користувачів зможуть подати чатботу зашифрований історичний текст і отримати його розшифровку.

Під час тестування чатбота на шифрі Борджа Меєші та її колеги виявили, що він може перекласти і розшифрувати фрагмент із 500 символів трохи більш ніж за 29 хвилин. Він навіть надав переклад англійською мовою.

Система також документувала процес і пояснювала, чому запропоноване рішення є ймовірним. Це важливо для того, щоб упевнитися, що ШІ не "галюцинує" і не вигадує інтерпретації.

Команда також нещодавно протестувала систему на двох інших шифрах, які вони раніше розшифрували і які представляють різні історичні періоди, мови, типи секретних кодів і рівні складності. Вона швидко їх дешифрувала, продемонструвавши здатність працювати з різними шифрами.

"ШІ найбільше допомагає з масштабом, швидкістю, виявленням закономірностей і інтеграцією завдань", - каже Меєші.

Такі інструменти можуть стати ключем до розкриття історичних шифрів, які досі залишалися загадкою. Вони також допоможуть із давніми текстами, написаними алфавітами, які сьогодні ніхто не може прочитати. Наприклад, 4000‑річний Фестський диск із Криту досі не розшифрований, як і ранньогрецька писемність "лінійне письмо B".

"Мене захоплює не лише можливість розв'язати одну конкретну історичну загадку, а й перспектива створення методів, які допоможуть дослідникам у багатьох різних випадках", - каже Меєші.

Skip Підписуйтеся на нас у соцмережах and continue readingПідписуйтеся на нас у соцмережах

End of Підписуйтеся на нас у соцмережах