Sociedad | TECNOLOGÍA

DeepSeek sacude el tablero

Tiempo de lectura: ...
Esteban Magnani

Llegó desde China un competidor directo de ChatGPT que puede revolucionar la inteligencia artificial. La novedad impactó en empresas tecnológicas, de energía y en fabricantes de procesadores de EE.UU.

Reacción en cadena. La app es una herramienta de bajo costo y su lanzamiento repercutió en las bolsas de todo el mundo.

Foto: Getty Images

Esta semana la gente no especializada en tecnología probablemente haya escuchado hablar de una nueva Inteligencia Artificial Generativa (IAG) proveniente de China llamada DeepSeek. La última versión de esta herramienta, de la startup del mismo nombre, se lanzó hace pocos días y un paper de la semana pasada dio detalles sobre su funcionamiento. Su desempeño es considerado ligeramente superior al de su competidora ChatGPT.

Esta aplicación de OpenAI se lanzó hace poco más de dos años, pero su funcionamiento tuvo tal impacto inicial que descencadenó una carrera a todo o nada entre las grandes corporaciones del mundo para desarrollar sus propios modelos. Si bien ya había algunas señales de preocupación por los enormes costos de estos desarrollos, la rápida adopción de DeepSeek por millones de usuarios produjo pánico en las bolsas del mundo.

Por ejemplo, el Nasdaq, con mucho peso de las tecnológicas más grandes, fuertes inversoras en IAG, cayó un 3,5% el lunes pasado. Las empresas de energía cayeron bastante más: por ejemplo, las acciones de GE Vernova, dedicada a turbinas eólicas y de gas, cayeron un 23%, y las de Vistra, dedicada a la generación de electricidad, un 30%. Nvidia, la fabricante de procesadores, perdió un 17%.

¿Cómo se explica semejante impacto por un servicio que hace básicamente lo mismo que el ya conocido ChatGPT?


Más con menos
Lo que más fuertemente impactó en las expectativas del mercado son los costos que la empresa asegura haber tenido para desarrollar una herramienta tan poderosa: solo 5,6 millones de dólares. La cifra puede parecer alta a simple vista, pero es poco o nada respecto de los cientos o miles de millones que costó el desarrollo de las distintas versiones de ChatGPT, Dall-e, Midjourney y otras.

En una entrevista de mediados de julio de 2024, el fundador de DeepSeek, Liang Wenfeng, explicaba que ellos podían desarrollar sus herramientas con 30 veces menos recursos que sus competidores. De hecho, apenas sus herramientas comenzaron a popularizarse en China, empresas locales como Bytedance, Alibaba o Baidu debieron bajar los precios de sus servicios.

Según cuentan los científicos de DeepSeek en el artículo publicado, semejante proeza se logró en parte porque, una vez entrenado el modelo, solo activa algunos módulos ante cada pedido, en lugar de encender todo. Esto permite un fuerte ahorro de energía, uno de los costos principales de estas herramientas.

Otra cuestión no menor es que esa eficiencia también permite utilizar procesadores Nvidia H800, que no solo consumen menos, sino que también son más baratos y están disponibles en China, pese a los bloqueos impuestos por EE.UU. Si el objetivo era ralentizar el desarrollo de su competidor, parece haber logrado lo contrario: según la empresa, esta dificultad funcionó como acicate para lograr modelos más eficientes.

En los últimos meses, Sam Altman, de OpenAI, y Elon Musk, pero también representantes de Alphabet y Meta, salieron a buscar miles de millones de dólares para sus desarrollos en IA. Incluso el presidente Donald Trump anunció hace días Stargate, una inversión privada de 500.000 millones de dólares en infraestructura para IA. En caso de que se compruebe realmente que DeepSeek encontró una forma de simplificar las tareas y ahorrar costos de manera brutal, las empresas estadounidenses pueden quedar en ridículo por el nivel de derroche del camino que eligieron. También, deberían reiniciar sus desarrollos bajo otro paradigma. Extrañamente, esto puede no ser tan complicado, ya que una de las particularidades de DeepSeek es que utiliza código abierto.


Desarrollos compartidos
En la entrevista antes mencionada, el fundador de DeepSeek explicaba que utilizan desarrollos de código abierto, es decir, que cualquiera puede ver cómo están hechas sus herramientas y experimentar con ellas. Esto genera que la innovación pueda provenir de cualquier lado y, como los resultados también son abiertos, la comunidad se enriquece: DeepSeek aprovechó eso de otros desarrolladores y ahora comparte sus resultados. En cambio, la mayoría de las empresas de EE.UU. prefieren el código cerrado para sacar ventaja a sus competidores, algo que los hace trabajar con secretismo y aislando a sus especialistas de posibles aportes externos. Esto también encarece el desarrollo.

Para Wenfeng «el código abierto y la publicación de artículos no resultan en pérdidas significativas. Para los tecnólogos, ser seguidos es gratificante. El código abierto es cultural, no solo comercial. Devolver es un honor y atrae talento». Según Wenfeng, DeepSeek puede habilitar un camino propio para el desarrollo de IAG en China que no implique solo seguir lo que se hace en EE.UU., sino superarlo.

Una de las excepciones estadounidenses al código cerrado es Meta. Uno de los líderes del proyecto de IAG de esa corporación, Yann LeCun, coincidía con esta mirada: «Para las personas que ven el rendimiento de DeepSeek y piensan: “China está superando a EE. UU. en inteligencia artificial”, están leyendo mal. La lectura correcta es: “Los modelos de código abierto están superando a los propietarios”».

Este tipo de herramientas también permitiría que emprendimientos o países con menos recursos se descarguen los modelos y los entrenen con información sensible que no deseen compartir con empresas privadas. También habilitaría el entrenamiento con datos propios, sin sesgos provenientes de otras culturas o realidades. De esta manera, el ecosistema de las IAG admitiría la entrada de jugadores más pequeños.

Los más escépticos descreen de los costos que esgrime la empresa y piensan que el dato está siendo utilizado por algunos especuladores para hacer bajar artificialmente algunas acciones y de esa manera comprarlas a precio de saldo. La hipótesis no es descabellada, pero tampoco cuenta con suficientes fundamentos. En caso de comprobarse lo que asegura DeepSeek, se abriría un nuevo capítulo en la disputa entre ambos países, en el que China tomaría su propio camino y superaría a EE.UU. No es un tema menor en la creciente disputa entre estos dos gigantes por la hegemonía global.

Estás leyendo:

Sociedad TECNOLOGÍA

DeepSeek sacude el tablero

Dejar un comentario

Tenés que estar identificado para dejar un comentario.