- Retour au menu
- Retour au menuTarifs
- Retour au menuRecherche
- Retour au menuConsensus
- Retour au menu
- Retour au menu
- Retour au menu
- Retour au menuWebinaires et Événements
Cinq méthodes d'apprentissage automatique que les traders de Crypto devraient connaître
La Crypto quantitative s'appuie sur un large éventail de techniques d'apprentissage automatique. En voici cinq, expliquées en détail.
Dans une récentearticleJ'ai évoqué la pertinence des techniques d'apprentissage automatique qui équipent le célèbre GPT-3 d'OpenAI pour le marché des Crypto . GPT-3, capable de répondre à des questions, d'effectuer des analyses linguistiques et de générer du texte, est sans doute l'une des avancées les plus marquantes de ces dernières années dans le domaine de l'apprentissage profond. Mais il est loin d'être le plus pertinent pour ce Crypto . Dans cet article, je souhaite aborder quelques nouveaux domaines de l'apprentissage profond susceptibles d'avoir un impact NEAR immédiat sur les modèles Quant appliqués aux Crypto.
Jesus Rodriguez est le PDG d'IntoTheBlock, une plateforme d'analyse de marché pour les Crypto . Il a occupé des postes de direction au sein de grandes entreprises Technologies et de fonds spéculatifs. Investisseur actif, il est également conférencier, auteur et maître de conférences invité à l'Université Columbia de New York.
Des modèles tels que GPT-3 ou BERT de Google sont le fruit d'une avancée majeure dans le domaine de l'apprentissage profond, connue sous le nom de modèles de pré-entraînement et de transformation du langage. Ces techniques représentent sans doute l'avancée la plus importante de ces dernières années dans le secteur de l'apprentissage profond, et leur impact n'est T passé inaperçu sur les Marchés financiers.
L'année dernière, des recherches actives en Finance quantitative ont été menées pour explorer l'application des modèles de transformateurs à différentes classes d'actifs. Cependant, les résultats restent incomplets, montrant que les transformateurs sont loin d'être opérationnels dans les ensembles de données financières et qu'ils restent principalement applicables aux données textuelles. Il n'y a toutefois aucune raison de s'en plaindre. Si l'adaptation des transformateurs aux scénarios financiers reste relativement complexe, d'autres nouveaux domaines de l'apprentissage profond se révèlent prometteurs lorsqu'ils sont appliqués aux modèles Quant sur diverses classes d'actifs, dont les Crypto.
Sous de nombreux angles, les Crypto semblent être la classe d'actifs idéale pour les modèles Quant basés sur l'apprentissage profond. Cela s'explique par leur ADN numérique et leur transparence, et par le fait que Crypto essor a coïncidé avec la renaissance de l'apprentissage automatique et l'émergence de l'apprentissage profond.
Après des décennies de lutte et quelques « hivers de l'intelligence artificielle (IA) », l'apprentissage profond est enfin devenu une réalité et une norme dans différents secteurs de l'industrie du logiciel. La Finance quantitative a été ONEune des plus rapides à adopter les nouvelles technologies et recherches en matière d'apprentissage profond. Il est très courant que certains des principaux fonds Quant du marché expérimentent les mêmes types d'idées issues de laboratoires de recherche en IA de pointe tels que Facebook, Google ou Microsoft.
Voir aussi :Jesus Rodriguez - 10 raisons pour lesquelles les stratégies Quant pour les Crypto échouent
Certaines des avancées les plus prometteuses du financement Quant moderne ne proviennent pas de techniques sophistiquées comme les transformateurs, mais de percées majeures en matière d'apprentissage automatique, plus adaptées aux scénarios Quant . Nombre de ces méthodes sont parfaitement applicables aux techniques Quant des crypto-actifs et commencent à faire leur chemin dans les modèles Quant Crypto .
Ci-dessous, j'ai répertorié cinq domaines émergents de l'apprentissage profond, particulièrement importants pour les scénarios de Crypto Quant . J'ai essayé de KEEP les explications et de les adapter aux scénarios Crypto .
1) Réseaux neuronaux graphiques
Les ensembles de données blockchain constituent une source unique d'alpha pour les modèles Quant dans le domaine des Crypto . D'un point de vue structurel, les données blockchain sont intrinsèquement hiérarchiques et représentées par un graphe dont les nœuds représentent les adresses et sont reliés par des arêtes représentant les transactions. Imaginez un scénario dans lequel un modèle Quant tente de prédire la volatilité. Bitcoindans une plateforme d'échange donnée, en fonction des caractéristiques des adresses transférant des fonds vers la plateforme. Ce type de modèle doit fonctionner efficacement sur des données hiérarchiques. Cependant, la plupart des techniques d'apprentissage automatique sont conçues pour fonctionner avec des ensembles de données tabulaires, et non des graphiques.
Les réseaux de neurones graphes (GNN) sont une nouvelle discipline d'apprentissage profond qui se concentre sur les modèles fonctionnant efficacement sur des structures de données graphes. Les GNN constituent un domaine relativement récent de l'apprentissage profond, inventé seulement en 2005. Cependant, ils ont été largement adoptés par des entreprises comme Uber, Google, Microsoft, DeepMind et d'autres.
Dans notre exemple de scénario, un GNN pourrait utiliser un graphique représentant les flux entrants et sortants des plateformes d'échange comme entrée et en déduire des informations pertinentes quant à son impact sur le prix. Dans le contexte des Crypto , les GNN pourraient permettre de nouvelles méthodes Quant basées sur des ensembles de données blockchain.
2) Modèles génératifs
ONEune des limites des modèles Quant d'apprentissage automatique est l'absence de vastes ensembles de données historiques. Imaginez que vous tentiez de construire un modèle prédictif au prix de Chainlink (LINK) basé sur son historique de trading. Bien que le concept semble attrayant, il pourrait s'avérer complexe, car LINK dispose d'un peu plus d'un an de données historiques de trading sur des plateformes comme Coinbase. Ce petit ensemble de données sera insuffisant pour que la plupart des réseaux neuronaux profonds puissent généraliser des connaissances pertinentes.
Les modèles génératifs sont une méthode d'apprentissage profond spécialisée dans la génération de données synthétiques correspondant à la distribution d'un jeu de données d'entraînement. Dans notre scénario, imaginons que nous entraînions un modèle génératif dans la distribution du carnet d'ordres de LINK dans Coinbase afin de générer de nouveaux ordres correspondant à la distribution du carnet d'ordres réel.
En combinant les données réelles et ONE, nous pouvons constituer un ensemble de données suffisamment volumineux pour entraîner un modèle d'apprentissage profond sophistiqué. Le concept de modèle génératif n'est pas particulièrement nouveau, mais il a connu un essor considérable ces dernières années avec l'émergence de techniques populaires telles que les réseaux neuronaux antagonistes génératifs (GAN), devenus ONEune des méthodes les plus répandues dans des domaines tels que la classification d'images et utilisés avec succès sur des séries chronologiques de données financières.
3) Apprentissage semi-supervisé
Les ensembles de données étiquetés sont rares dans le secteur des Crypto , ce qui limite considérablement les modèles Quant d'apprentissage automatique (ML) pouvant être construits en situation réelle. Imaginons que nous essayions de créer un modèle ML capable de prédire les prix en fonction de l'activité des plateformes de gré à gré (OTC). Pour entraîner ce modèle, nous aurions besoin d'un vaste ensemble de données étiquetées contenant les adresses de ces plateformes, un type de données que seules quelques entités du marché des Crypto possèdent.
L'apprentissage semi-supervisé est une technique d'apprentissage profond qui se concentre sur la création de modèles capables Guides avec de petits ensembles de données étiquetées et un grand volume de données non étiquetées. L'apprentissage semi-supervisé est comparable à un enseignant présentant quelques concepts à un groupe d'élèves et laissant les autres concepts aux devoirs et à l'auto-apprentissage.
Dans notre exemple, imaginons que nous entraînions un modèle avec un petit ensemble de transactions étiquetées provenant de plateformes OTC et un grand ensemble de transactions non étiquetées. Notre modèle d'apprentissage semi-supervisé Guides des caractéristiques clés de l'ensemble de données étiquetées, telles que la taille ou la fréquence des transactions, et utilisera l'ensemble de données non étiquetées pour étendre l'apprentissage.
4) Apprentissage par représentation
L'extraction et la sélection de caractéristiques sont un élément clé de tout modèle d'apprentissage automatique Quant et sont particulièrement pertinentes pour les problèmes peu connus, comme les prédictions sur les Crypto . Imaginez que nous essayions de construire un modèle prédictif du prix du Bitcoin basé sur les enregistrements du carnet d'ordres.
ONEun des aspects les plus importants de notre démarche consiste à déterminer quels attributs ou caractéristiques peuvent servir de prédicteurs. S'agit-il du prix moyen, du volume ou d'une centaine d'autres facteurs ? L'approche traditionnelle consiste à faire appel à des experts pour concevoir ces caractéristiques, mais cela peut s'avérer difficile à adapter et à maintenir au fil du temps.
L'apprentissage des représentations est un domaine de l'apprentissage profond axé sur l'automatisation de l'apprentissage de représentations ou de caractéristiques solides afin de construire des modèles plus performants. Au lieu de s'appuyer sur la modélisation Human des caractéristiques, l'apprentissage des représentations tente d'extrapoler les caractéristiques directement à partir d'ensembles de données non étiquetés. Dans notre exemple, une méthode d'apprentissage des représentations pourrait analyser le carnet d'ordres et identifier des centaines de milliers de caractéristiques potentielles pouvant servir de prédicteurs du cours du Bitcoin . Un tel niveau d'évolutivité et d'automatisation est impossible à atteindre avec l'ingénierie manuelle des caractéristiques.
5) Recherche d'architecture neuronale
Le processus de création de modèles d'apprentissage automatique Quant reste très subjectif à bien des égards. Prenons le cas d'un modèle tentant de prédire le prix de Ethereum en fonction de l'activité d'un ensemble de protocoles DeFi. Compte tenu de la nature du problème, les data scientists auront des préférences quant au type de modèle et d'architecture à utiliser.
Dans notre scénario, la plupart de ces idées reposeraient sur des connaissances du domaine et des opinions subjectives quant à l'impact de l'activité des protocoles DeFi sur le prix de Ethereum. Étant donné que l'apprentissage automatique repose sur la construction de connaissances et que celles-ci ne constituent pas une unité distincte, il est quasiment impossible de débattre des mérites d' une méthode par rapport à une autre pour un problème donné.
La recherche d'architecture neuronale (NAS) est un domaine de l'apprentissage profond qui vise à automatiser la création de modèles grâce au machine learning. Il s'agit en quelque sorte d'utiliser le machine learning pour créer du machine learning. À partir d'un problème cible et d'un ensemble de données, les méthodes NAS évaluent des centaines d'architectures de réseaux neuronaux possibles et génèrent celles qui présentent les résultats les plus prometteurs.
Dans notre exemple de scénario, une méthode NAS peut traiter un ensemble de données qui intègre des transactions dans des échanges décentralisés et produire quelques modèles qui peuvent potentiellement prédire le prix d' Ethereum sur la base de ces enregistrements.
Plus à venir
Les méthodes décrites ci-dessus représentent des domaines émergents et plus développés de l'apprentissage profond, susceptibles d'avoir un impact sur les modèles Crypto Quant à court terme. Et ce ne sont en aucun cas les seuls domaines de l'apprentissage profond et de la Crypto Quant auxquels il convient de prêter attention.
D'autres disciplines d'apprentissage profond, telles que l'apprentissage par renforcement, l'apprentissage auto-supervisé et même les transformateurs, progressent rapidement dans le domaine Quant . La recherche et l'expérimentation sur les techniques d'apprentissage profond appliquées aux modèles Quant sont omniprésentes, et la Crypto est en passe de bénéficier grandement de cette vague d'innovation.
Remarque : Les opinions exprimées dans cette colonne sont celles de l'auteur et ne reflètent pas nécessairement celles de CoinDesk, Inc. ou de ses propriétaires et affiliés.
Jesus Rodriguez
Jesus Rodriguez est PDG et cofondateur d'IntoTheBlock, une plateforme dédiée à la veille concurrentielle et aux solutions DeFi institutionnelles pour les Marchés des Crypto . Il est également cofondateur et président de Faktory, une plateforme d'IA générative pour applications professionnelles et grand public. Il a également fondé The Sequence, ONEune des Newsletters d'IA les plus populaires au monde. Outre son activité opérationnelle, Jesus est conférencier invité à l'Université Columbia et à la Wharton Business School, et est un écrivain et conférencier très actif.
