Compartir este artículo

Cinco métodos de aprendizaje automático que los inversores de Cripto deberían conocer

Las Finanzas cuantitativas con Cripto cuentan con una amplia gama de técnicas de aprendizaje automático. A continuación, se presentan cinco, explicadas por sus características.

En un recienteartículoAnalicé la relevancia que las técnicas de aprendizaje automático que impulsan el famoso GPT-3 de OpenAI podrían tener para el mercado de las Cripto . GPT-3, capaz de responder preguntas, realizar análisis de lenguaje y generar texto, podría ser uno de los logros más destacados de los últimos años en el ámbito del aprendizaje profundo. Sin embargo, no es, en absoluto, el más aplicable al sector de las Cripto . En este artículo, me gustaría analizar algunas áreas novedosas del aprendizaje profundo que podrían tener un impacto NEAR inmediato en los modelos Quant aplicados a las Cripto.

CONTINÚA MÁS ABAJO
No te pierdas otra historia.Suscríbete al boletín de The Protocol hoy. Ver Todos Los Boletines

Jesús Rodríguez es el CEO de IntoTheBlock, una plataforma de inteligencia de mercado para Cripto . Ha ocupado puestos de liderazgo en importantes empresas Tecnología y fondos de cobertura. Es un inversor activo, orador, autor y profesor invitado en la Universidad de Columbia en Nueva York.

Modelos como GPT-3 o BERT de Google son el resultado de un avance masivo en el aprendizaje profundo, conocido como modelos de lenguaje preentrenado y transformador. Estas técnicas, posiblemente, representan el mayor hito en los últimos años de la industria del aprendizaje profundo y su impacto no ha pasado desapercibido en los Mercados de capitales.

Durante el último año, se han llevado a cabo investigaciones activas en Finanzas cuantitativas que exploran la aplicación de los modelos de transformadores a diferentes clases de activos. Sin embargo, los resultados de estas investigaciones siguen siendo incompletos, lo que demuestra que los transformadores aún están lejos de estar listos para operar en conjuntos de datos financieros y que su aplicación principal es a datos textuales. Sin embargo, no hay motivo para sentirse mal. Si bien adaptar los transformadores a escenarios financieros sigue siendo relativamente difícil, otras nuevas áreas del aprendizaje profundo se muestran prometedoras al aplicarse en modelos Quant en diversas clases de activos, incluyendo las Cripto.

Desde muchos ángulos, las Cripto parecen ser la clase de activo ideal para los modelos Quant basados ​​en aprendizaje profundo. Esto se debe a su ADN digital y a su transparencia, y a que su Cripto ha coincidido con el resurgimiento del aprendizaje Cripto y la aparición del aprendizaje profundo.

Tras décadas de lucha y un par de los llamados "inviernos de la inteligencia artificial (IA)", el aprendizaje profundo finalmente se ha convertido en una realidad y se ha generalizado en diversas áreas de la industria del software. Las Finanzas cuantitativas han sido una de las que más rápido han adoptado las nuevas tecnologías e investigaciones de aprendizaje profundo. Es muy común que algunos de los principales fondos Quant del mercado experimenten con las mismas ideas que surgen de laboratorios de investigación de IA de alta tecnología como Facebook, Google o Microsoft.

Ver también:Jesús Rodríguez - 10 razones por las que las estrategias Quant para las Cripto fracasan

Algunos de los avances más prometedores en la financiación Quant moderna no provienen de técnicas sofisticadas como los transformadores, sino de emocionantes avances en aprendizaje automático, más desarrollados para escenarios Quant . Muchos de estos métodos son perfectamente aplicables a las técnicas Quant de criptoactivos y están comenzando a incursionar en los modelos Quant de Cripto .

A continuación, he enumerado cinco áreas emergentes del aprendizaje profundo que son particularmente importantes para los escenarios de Cripto . Intenté KEEP las explicaciones relativamente sencillas y adaptadas a los escenarios de Cripto .

1) Redes neuronales gráficas

Los conjuntos de datos de blockchain son una fuente única de alfa para los modelos Quant en el ámbito de las Cripto . Desde una perspectiva estructural, los datos de blockchain son intrínsecamente jerárquicos y se representan mediante un grafo con nodos que representan direcciones, conectados por aristas que representan transacciones. Imagine un escenario en el que un modelo Quant intenta predecir la volatilidad en BitcoinEn una plataforma de intercambio determinada, según las características de las direcciones que transfieren fondos a la plataforma. Este tipo de modelo debe funcionar eficientemente con datos jerárquicos. Sin embargo, la mayoría de las técnicas de aprendizaje automático están diseñadas para trabajar con conjuntos de datos tabulares, no con gráficos.

Las redes neuronales de grafos (GNN) son una nueva disciplina de aprendizaje profundo que se centra en modelos que operan eficientemente en estructuras de datos de grafos. Las GNN son un área relativamente nueva del aprendizaje profundo, inventada apenas en 2005. Sin embargo, han sido ampliamente adoptadas por empresas como Uber, Google, Microsoft, DeepMind y otras.

En nuestro escenario de ejemplo, una GNN podría usar un gráfico como entrada que represente los flujos de entrada y salida de las plataformas de intercambio e inferir información relevante sobre su impacto en el precio. En el contexto de los Cripto , las GNN tienen el potencial de habilitar nuevos métodos Quant basados ​​en conjuntos de datos de blockchain.

2) Modelos generativos

Una de las limitaciones de los modelos Quant de aprendizaje automático es la falta de grandes conjuntos de datos históricos. Supongamos que intenta construir un modelo predictivo para el precio de... Chainlink (LINK) basado en su comportamiento comercial histórico. Si bien el concepto parece atractivo, podría resultar complejo, ya que LINK cuenta con poco más de un año de datos comerciales históricos en plataformas de intercambio como Coinbase. Ese pequeño conjunto de datos será insuficiente para que la mayoría de las redes neuronales profundas generalicen cualquier conocimiento relevante.

Los modelos generativos son un tipo de método de aprendizaje profundo especializado en generar datos sintéticos que coinciden con la distribución de un conjunto de datos de entrenamiento. En nuestro escenario, imaginemos que entrenamos un modelo generativo con la distribución del libro de órdenes LINK en Coinbase para generar nuevas órdenes que coincidan con la distribución del libro de órdenes real.

Al combinar el conjunto de datos real y el ONE, podemos construir un conjunto de datos lo suficientemente grande como para entrenar un modelo sofisticado de aprendizaje profundo. El concepto de modelo generativo no es particularmente nuevo, pero ha cobrado mucha importancia en los últimos años con la aparición de técnicas populares como las redes neuronales generativas antagónicas (GAN), que se han convertido en ONE de los métodos más populares en áreas como la clasificación de imágenes y se han utilizado con éxito en conjuntos de datos financieros de series temporales.

3) Aprendizaje semisupervisado

Los conjuntos de datos etiquetados son escasos en el sector de las Cripto , lo que limita considerablemente el tipo de modelos Quant de aprendizaje automático (AA) que se pueden construir en situaciones reales. Imaginemos que intentamos construir un modelo de AA que realiza predicciones de precios basadas en la actividad de las mesas de negociación extrabursátil (OTC). Para entrenar dicho modelo, necesitaríamos un gran conjunto de datos etiquetados con direcciones pertenecientes a mesas OTC, un tipo de conjunto de datos que solo poseen unas pocas entidades en el mercado de Cripto .

El aprendizaje semisupervisado es una técnica de aprendizaje profundo que se centra en la creación de modelos capaces de Aprende con pequeños conjuntos de datos etiquetados y un gran volumen de datos sin etiquetar. El aprendizaje semisupervisado es similar a cuando un profesor presenta algunos conceptos a un grupo de estudiantes y deja los demás para la tarea y el autoaprendizaje.

En nuestro escenario de ejemplo, imaginemos que entrenamos un modelo con un pequeño conjunto de operaciones etiquetadas de mesas OTC y un gran conjunto de operaciones sin etiquetar. Nuestro modelo de aprendizaje semisupervisado Aprende características clave del conjunto de datos etiquetados, como el tamaño o la frecuencia de las operaciones, y utilizará el conjunto de datos sin etiquetar para ampliar el entrenamiento.

4) Aprendizaje de representación

La extracción y selección de características es un componente clave de cualquier modelo de aprendizaje automático Quant y es especialmente relevante en problemas poco comprendidos, como las predicciones de Cripto . Imaginemos que intentamos construir un modelo predictivo del precio de Bitcoin basado en los registros del libro de órdenes.

ONE de los aspectos más importantes de nuestro esfuerzo es determinar qué atributos o características pueden actuar como predictores. ¿Se trata del precio medio, el volumen o de otros cien factores? El enfoque tradicional consiste en confiar en expertos en la materia para que diseñen estas características, pero esto puede resultar difícil de escalar y mantener con el tiempo.

El aprendizaje de representación es un área del aprendizaje profundo centrada en la automatización del aprendizaje de representaciones o características sólidas para construir modelos más efectivos. En lugar de depender del modelado de características Human , el aprendizaje de representación intenta extrapolar características directamente de conjuntos de datos sin etiquetar. En nuestro ejemplo, un método de aprendizaje de representación podría analizar la cartera de órdenes e identificar cientos de miles de características potenciales que podrían predecir el precio de Bitcoin . Ese nivel de escalabilidad y automatización es imposible de lograr con la ingeniería de características manual.

5) Búsqueda de arquitectura neuronal

El proceso de creación de modelos de aprendizaje automático Quant sigue siendo muy subjetivo en muchos aspectos. Imaginemos un modelo que intenta pronosticar el precio de Ethereum basándose en la actividad en un conjunto de protocolos DeFi. Dada la naturaleza del problema, los científicos de datos tendrán ciertas preferencias sobre el tipo de modelo y arquitectura a utilizar.

En nuestro escenario, la mayoría de esas ideas se basarían en el conocimiento del dominio y en opiniones subjetivas sobre cómo la actividad en los protocolos DeFi puede afectar el precio de Ethereum. Dado que el aprendizaje automático se basa en la construcción de conocimiento y este no es una unidad discreta, es casi imposible debatir las ventajas de un método frente a otro para un problema determinado.

La búsqueda de arquitectura neuronal (NAS) es un área del aprendizaje profundo que busca automatizar la creación de modelos mediante aprendizaje automático. Es decir, se usa el aprendizaje automático para crear aprendizaje automático. Dado un problema objetivo y un conjunto de datos, los métodos NAS evalúan cientos de posibles arquitecturas de redes neuronales y generan las que ofrecen los resultados más prometedores.

En nuestro escenario de muestra, un método NAS puede procesar un conjunto de datos que incorpora transacciones en intercambios descentralizados y producir algunos modelos que potencialmente pueden predecir el precio de Ethereum en función de esos registros.

Más por venir

Los métodos descritos anteriormente representan algunas áreas emergentes y más desarrolladas del aprendizaje profundo que probablemente impactarán los modelos Cripto a corto plazo. Y estas no son, ni mucho menos , las únicas áreas del aprendizaje profundo a las que la Cripto debería prestar atención.

Otras disciplinas de aprendizaje profundo, como el aprendizaje por refuerzo, el aprendizaje autosupervisado e incluso los transformadores, se están abriendo camino rápidamente en el ámbito Quant . La investigación y la experimentación sobre técnicas de aprendizaje profundo aplicadas a modelos Quant son omnipresentes, y la Cripto se perfila como una gran beneficiaria de esta ola de innovación.

Nota: Las opiniones expresadas en esta columna son las del autor y no necesariamente reflejan las de CoinDesk, Inc. o sus propietarios y afiliados.

Jesus Rodriguez

Jesús Rodríguez es el CEO y cofundador de IntoTheBlock, una plataforma enfocada en facilitar inteligencia de mercado y soluciones DeFi institucionales para los Mercados de Cripto . También es cofundador y presidente de Faktory, una plataforma de IA generativa para aplicaciones empresariales y de consumo. Jesús también fundó The Sequence, ONE de los Newsletters sobre IA más populares del mundo. Además de su trabajo operativo, Jesús es profesor invitado en la Universidad de Columbia y la Wharton Business School, y es un escritor y orador muy activo.

Jesus Rodriguez