- Повернутися до менюЦіни
- Повернутися до менюдослідження
- Повернутися до менюКонсенсус
- Повернутися до менюСпонсорський матеріал
- Повернутися до меню
- Повернутися до меню
- Повернутися до меню
- Повернутися до менюВебінари та Заходи
П’ять методів машинного навчання, про які варто знати Крипто
Фінанси Крипто широкий набір методів машинного навчання. Ось п’ять із поясненнями їхніх характеристик.
У недавньому стаття, я обговорював доцільність методів машинного навчання, що реалізують відомий OpenAI GPT-3, який міг мати для Крипто . GPT-3, який може відповідати на запитання, виконувати аналіз мови та генерувати текст, може бути найвідомішим досягненням за останні роки у просторі глибокого навчання. Але в жодному разі він не є найбільш застосовним до Крипто . У цій статті я хотів би обговорити деякі нові області глибокого навчання, які можуть мати NEAR негайний вплив на Quant моделі, застосовані до Крипто.
Хесус Родрігес є генеральним директором IntoTheBlock, платформи ринкової інформації для Крипто . Він займав керівні посади у великих Технології компаніях і хедж-фондах. Він є активним інвестором, спікером, автором і запрошеним лектором у Колумбійському університеті в Нью-Йорку.
Такі моделі, як GPT-3 або BERT від Google, є результатом масштабного прориву в глибокому навчанні, відомому як мовні попередньо підготовлені та трансформаторні моделі. Ці методи, можливо, є найбільшою віхою за останні кілька років індустрії глибокого навчання, і їхній вплив T залишився непоміченим на Ринки капіталу.
Протягом останнього року проводилися активні дослідницькі роботи з кількісних Фінанси , які досліджували, як моделі трансформаторів можна застосувати до різних класів активів. Однак результати цих зусиль залишаються уривчастими, показуючи, що трансформатори ще далекі від готовності до роботи з наборами фінансових даних і вони залишаються здебільшого застосовними до текстових даних. Але причин погано почуватися немає. У той час як адаптація трансформаторів до фінансових сценаріїв залишається відносно складною, інші нові сфери простору глибокого навчання є перспективними, якщо застосовувати їх у Quant моделях для різних класів активів, включаючи Крипто.
З багатьох точок зору Крипто виглядає як ідеальний клас активів для Quant моделей на основі глибокого навчання. Це пов’язано з цифровою ДНК і прозорістю Крипто , а розвиток Крипто збігся з ренесансом машинного навчання та появою глибокого навчання.
Після десятиліть боротьби та кількох так званих «зим штучного інтелекту» глибоке навчання нарешті стало реальним і стало певною мірою основним у різних сферах індустрії програмного забезпечення. Кількісні Фінанси були ONE з тих, хто найшвидше впровадив нові технології глибокого навчання та дослідження. Дуже часто деякі з найбільших Quant фондів на ринку експериментують з тими самими типами ідей, які виходять із високотехнологічних дослідницьких лабораторій ШІ, таких як Facebook, Google або Microsoft.
Дивіться також: Хесус Родрігес - 10 причин невдачі Quant стратегій Крипто
Деякі з найбільш захоплюючих подій у сучасному Quant фінансуванні походять не від яскравих методів, таких як трансформатори, а від захоплюючих проривів у машинному навчанні, які більш розроблені для Quant сценаріїв. Багато з цих методів ідеально застосовні до Quant методів криптоактивів і починають проникати в Quant моделі Крипто .
Нижче я перерахував п’ять нових областей глибокого навчання, які особливо важливі для сценаріїв Quant Крипто . Я намагався KEEP пояснення відносно простими та пристосованими до Крипто .
1) Граф нейронних мереж
Набори даних блокчейну є унікальним джерелом альфа-версії для Quant моделей у Крипто . Зі структурної точки зору, дані блокчейну за своєю суттю є ієрархічними та представлені графом із вузлами, що представляють адреси, з’єднані ребрами, що представляють транзакції. Уявіть собі сценарій, у якому Quant модель намагається передбачити волатильність Bitcoin в певному обміні на основі характеристик адрес переказу коштів на обмін. Така модель повинна ефективно працювати над ієрархічними даними. Але більшість методів машинного навчання розроблені для роботи з табличними наборами даних, а не з графіками.
Графові нейронні мережі (GNN) — це нова дисципліна глибокого навчання, яка зосереджена на моделях, які ефективно працюють із структурами графових даних. GNN є відносно новою сферою глибокого навчання, яку винайшли лише в 2005 році. Однак GNN отримали багато запроваджень від таких компаній, як Uber, Google, Microsoft, DeepMind та інших.
У нашому прикладі сценарію GNN може використовувати графік як вхідні дані, що представляють потоки вхідних і вихідних потоків з бірж, і отримати відповідні знання, що стосуються його впливу на ціну. У контексті Крипто GNN мають потенціал для створення нових Quant методів на основі наборів даних блокчейну.
2) Твірні моделі
ONE із обмежень Quant моделей машинного навчання є відсутність великих історичних наборів даних. Припустімо, що ви намагаєтеся побудувати прогнозну модель для ціни Chainlink (LINK) на основі його історичної торгової поведінки. Хоча концепція здається привабливою, вона може виявитися складною, оскільки LINK має трохи більше ніж рік історичних даних торгівлі на біржах, таких як Coinbase. Цього невеликого набору даних буде недостатньо для більшості глибоких нейронних мереж для узагальнення будь-яких відповідних знань.
Генеративні моделі — це тип методу глибокого навчання, що спеціалізується на генеруванні синтетичних даних, які відповідають розподілу навчального набору даних. У нашому сценарії уявіть, що ми навчаємо генеративну модель розподілу книги LINK у Coinbase, щоб генерувати нові замовлення, які відповідають розподілу реальної книги замовлень.
Поєднуючи реальний набір даних і ONE, ми можемо створити достатньо великий набір даних для навчання складної моделі глибокого навчання. Концепція генеративної моделі не є особливо новою, але набула великої популярності останнім часом із появою популярних методів, таких як генеративні суперницькі нейронні мережі (GAN), які стали ONE із найпопулярніших методів у таких сферах, як класифікація зображень, і успішно використовувалися з наборами фінансових даних часових рядів.
3) Напівконтрольоване навчання
Помічені набори даних є дефіцитними в Крипто , і це сильно обмежує тип Quant моделей машинного навчання (ML), які можна створити в реальних сценаріях. Уявіть, що ми намагаємося побудувати модель ML, яка прогнозує ціни на основі активності позабіржових відділень. Щоб навчити цю модель, нам знадобиться великий мічений набір даних з адресами, що належать позабіржовим столам. Це тип набору даних, яким володіють лише кілька суб’єктів на ринку Крипто .
Напівконтрольоване навчання – це техніка глибокого навчання, яка зосереджена на створенні моделей, які можуть Навчання за допомогою невеликих наборів даних із мітками та великого обсягу даних без міток. Навчання під напівконтролем подібне до того, як учитель представляє кілька концепцій групі студентів і залишає інші концепції для домашнього завдання та самостійного вивчення.
У нашому прикладі сценарію уявіть, що ми навчаємо модель з невеликим набором мічених угод з позабіржових столів і великим набором немаркованих. Наша напівконтрольована модель навчання буде Навчання ключові характеристики з позначеного набору даних, наприклад розмір торгівлі або частоту, і використовуватиме не позначений набір даних для розширення навчання.
4) Репрезентативне навчання
Виділення та вибір функцій є ключовим компонентом будь-якої моделі Quant машинного навчання і особливо актуальні в проблемах, які не дуже добре зрозумілі, наприклад, прогнозування Крипто . Уявіть, що ми намагаємося побудувати прогнозну модель для ціни Bitcoin на основі записів книги замовлень.
ONE із найважливіших аспектів наших зусиль є визначення того, які атрибути чи особливості можуть діяти як предиктори. Це середня ціна, обсяг чи сотні інших факторів? Традиційний підхід полягає в тому, щоб покладатися на експертів із предметних питань, щоб створити ці функції вручну, але це може стати важко масштабувати та підтримувати з часом.
Навчання репрезентації — це область поглибленого навчання, зосереджена на автоматизації вивчення суцільних репрезентацій або функцій з метою створення більш ефективних моделей. Замість того, щоб покладатися на моделювання властивостей Human , навчання репрезентації намагається екстраполювати функції безпосередньо з немаркованих наборів даних. У нашому прикладі метод навчання репрезентації може проаналізувати книгу замовлень і визначити сотні тисяч потенційних функцій, які можуть діяти як предиктори цін на Bitcoin . Такого рівня масштабування та автоматизації неможливо досягти в ручному проектуванні функцій.
5) Пошук нейронної архітектури
Процес створення Quant моделей машинного навчання залишається дуже суб’єктивним у багатьох аспектах. Давайте візьмемо сценарій моделі, яка намагається спрогнозувати ціну Ethereum на основі активності в наборі протоколів DeFi. Враховуючи характер проблеми, дослідники даних матимуть певні переваги щодо типу моделі та архітектури для використання.
У нашому сценарії більшість цих ідей ґрунтуватимуться на знаннях домену та суб’єктивних думках про те, як діяльність у протоколах DeFi може вплинути на ціну Ethereum. Враховуючи, що машинне навчання базується на створенні знань, а знання не є окремою одиницею, майже неможливо обговорювати переваги ONE методу порівняно з іншим для певної проблеми.
Пошук нейронної архітектури (NAS) — це ONE з областей глибокого навчання, яка намагається автоматизувати створення моделей за допомогою машинного навчання. Начебто використання машинного навчання для створення машинного навчання. Враховуючи цільову проблему та набір даних, методи NAS оцінять сотні можливих архітектур нейронних мереж і виведуть ті з найбільш багатообіцяючими результатами.
У нашому прикладі сценарію метод NAS може обробляти набір даних, який включає угоди на децентралізованих біржах, і створювати кілька моделей, які потенційно можуть передбачити ціну Ethereum на основі цих записів.
Більше буде
Методи, описані вище, представляють деякі нові та більш розвинені області глибокого навчання, які, ймовірно, матимуть вплив на Quant моделі Крипто в короткостроковій перспективі. І це далеко не єдині області глибокого навчання Крипто , на які варто звернути увагу.
Інші дисципліни глибокого навчання, такі як навчання з підкріпленням, самоконтрольоване навчання та навіть трансформатори, стрімко просуваються в Quant просторі. Дослідження та експерименти щодо методів глибокого навчання, застосованих до Quant моделей, відбуваються скрізь, і Крипто стане великим бенефіціаром цієї хвилі інновацій.
Примітка: Погляди, висловлені в цьому стовпці, належать автору і не обов'язково відображають погляди CoinDesk, Inc. або її власників та афіліатів.
Jesus Rodriguez
Хесус Родрігес є генеральним директором і співзасновником IntoTheBlock, платформи , яка зосереджена на забезпеченні ринкової інформації та інституційних рішень DeFi для Крипто . Він також є співзасновником і президентом Faktory, генеративної платформи штучного інтелекту для бізнес-програм і програм для споживачів. Ісус також заснував The Sequence, ONE із найпопулярніших Розсилки ШІ у світі. На додаток до своєї операційної роботи, Ісус є запрошеним лектором у Колумбійському університеті та Wharton Business School, а також є дуже активним письменником і оратором.
