Innex Digest Abril 26

Josep Mª Monguet Fierro
Apr 20
8 min de lectura

Clínica

LLMs fallen clínicament malgrat superar benchmarks de seguretat

Un estudi amb models com GPT-4o i Llama 3.1 mostra que, tot i complir criteris de seguretat, fallen en fins a un 20% de respostes en contextos de salut mental. En comparació, terapeutes humans responen adequadament en el 93% dels casos. Els resultats indiquen que els benchmarks actuals mesuren evitar danys però no qualitat clínica real.

Publicat a arXiv

Un model clínic prediu com serà la següent visita amb dades longitudinals

Un model entrenat amb més d’un milió de pacients utilitza històries clíniques electròniques seqüencials per predir els esdeveniments de la següent visita.

Publicat a arXiv

La Xina aprova el primer BCI comercial per a paràlisi

S’ha autoritzat el primer sistema d’interfície cervell-ordinador disponible per a persones amb tetraplegia per lesió medul·lar cervical. El dispositiu capta la intenció de moviment i la tradueix en ordres per a un guant robòtic que ajuda a recuperar la prensió de la mà.

Publicat a Reuters

MetaLens amb IA permet ecografia a través de les costelles

Investigadors de la University of Hong Kong han desenvolupat una lent basada en metamaterials i IA que permet visualitzar en temps real estructures cardíaques fins a aproximadament 10 cm darrere de la caixa toràcica. El sistema podria substituir parcialment proves amb radiació com el TC en entorns crítics com urgències o UCI.

Ho explica la University of Hong Kong

IA prediu demanda hospitalària amb dades clíniques i calendari

Amb prop de 200.000 visites pediàtriques en 9 hospitals un model d’IA pot anticipar la demanda amb un error del 8,71% a 24 h i del 9,18% a 7 dies. Les variables més determinants són calendari i motius de consulta. Publicat a Intelligence-Based Medicine

Frontera

Model d’IA prediu activitat cerebral amb dades multimodals

TRIBE és un model que prediu patrons d’activació cerebral mesurats amb fMRI a partir de vídeo, àudio i text. El sistema permet simular respostes neuronals in silico i explorar la relació entre estímuls i activitat cerebral. Es tracta d’una validació experimental encara sense aplicació clínica directa.

Ho explica Meta

Xiaomi també prova robots humanoides en una fàbrica de vehicles

Segons el president de la companyia, dos robots humanoides han completat prop del 90% de les tasques assignades dins la seva planta de vehicles elèctrics.

Declaracions a Xiaomi

La IA ajuda… però pot fer perdre habilitats clíniques

Tot i millorar l’eficiència, la IA pot afavorir dependència i erosió de competències mèdiques. En colonoscòpia, la detecció d’adenomes va baixar del 28,4% al 22,4% en retirar la IA; en radiologia, errors del sistema van augmentar falsos positius fins al 12%; i en patologia, més del 30% dels professionals van canviar diagnòstics correctes sota pressió.

Publicat com a Scoping review

La IA pot externalitzar també les nostres creences

Un treball descriu el “belief offloading”: el moment en què la IA deixa de ser només una ajuda cognitiva i passa a influir en la formació, manteniment i revisió de les creences, normes i comportaments.

Article a arXiv

Societat

Un de cada tres adults ja consulta IA per temes de salut

Una enquesta de KFF indica que el 32% dels adults als EUA han utilitzat eines d’IA durant l’últim any per obtenir informació o consell sobre salut i el 41% dels usuaris hi han pujat dades mèdiques personals.

Enquesta completa a KFF

Experts i població discrepen sobre l’impacte de la IA

L’informe 2026 de Stanford HAI mostra que el 73% dels experts en IA veuen positivament el seu impacte en el treball, mentre només el 23% de la població general comparteix aquesta visió. Aquesta bretxa evidencia una desalineació rellevant entre desenvolupament tecnològic i percepció social, amb implicacions directes per a l’adopció de la IA en entorns clínics i professionals.

Estudi de Hai.Stanford

Wiquipedia veta l’ús de LLM per escriure articles

La Viquipèdia en anglès ha formalitzat una norma que prohibeix usar models de llenguatge per generar o reescriure contingut d’articles, amb excepcions limitades per a correcció bàsica del propi text i traducció sota verificació humana.

Política oficial de Wiquipedia

S’obre un mapa de professions exposades a la IA

Una eina puntua 342 ocupacions del Occupational Outlook Handbook del BLS segons la seva exposició digital a la IA i les visualitza en un mapa interactiu.

Projecte de Karpathy

El consum massiu de tokens d’IA revela límits de cost

L’ús intensiu de models d’IA dins grans empreses com Meta comença a evidenciar un límit econòmic. Un empleat hauria consumit 328,5 mil milions de tokens en 30 dies, una xifra que hauria equivalgut a gairebé 2 milions de dòlars segons preus públics dels models. Aquest cas apunta a un canvi de fase: de l’adopció accelerada de la IA cap a la necessitat de control i optimització del cost.

S’explica a The Information

Operacions

NVIDIA impulsa models oberts frontier amb una nova coalició

La Nemotron Coalition uneix vuit laboratoris d’IA per desenvolupar models frontier oberts. El primer projecte serà un model base co-desenvolupat amb Mistral AI, orientat a alimentar la futura família Nemotron 4 i ampliar l’accés a models avançats fora dels grans sistemes tancats.

Notícia de Nvidia

Tufts estima 9,3 milions de feines vulnerables a la IA

L’American AI Jobs Risk Index de Tufts calcula que 9,3 milions de llocs de treball als EUA podrien quedar exposats a desplaçament per IA en els pròxims 2 a 5 anys. L’informe assenyala que el risc es concentra en ocupacions cognitives i ben remunerades, com programació, escriptura i anàlisi, més que no pas en feines manuals.

Publicat a Tufts

Aplicació de la IA per optimitzar assaigs clínics

Novo Nordisk afirma que ja utilitza IA per identificar subpoblacions de pacients, millorar el disseny dels assaigs i seleccionar centres. El treball s’alimenta de dades harmonitzades d’uns 1.600 assaigs clínics.

Segons la Memòria Anual 2024

La IA escurça el prototipat de mesos a dies

L’ús d’eines d’IA generativa permet construir prototips funcionals en dies en lloc de setmanes o mesos, segons reportatges recents sobre pràctiques en startups. Aquest canvi redueix la dependència de processos tradicionals de desenvolupament i accelera la iteració inicial de producte.

Reportatge a The Information

La consultoria adapta el model de negoci en el context de la IA

PwC US està reconfigurant els seus serveis professionals amb la plataforma PwC One i preus basats en subscripció o consum, en lloc del model clàssic d’hores facturades. El canvi mostra com la IA no només automatitza tasques, sinó que comença a alterar el model de negoci de la consultoria i el tipus de talent que aquestes firmes necessiten.

Notícia a PwC

Shopify obre la porta a agents d’IA operant botigues

Shopify ha llançat un AI Toolkit que permet connectar agents d’IA com Claude o Codex directament amb botigues reals mitjançant APIs oficials. A diferència dels usos anteriors, els agents poden executar accions com crear productes, modificar preus o gestionar inventari dins l’entorn productiu. Aquest canvi marca el pas de la IA com a assistent a la IA com a operador en sistemes digitals.

Ho explica Shopify

Regulació

Un jurat vincula disseny digital amb dany en salut mental

Un jurat als EUA ha determinat que Meta i YouTube són responsables de danys en salut mental associats al disseny addictiu de les seves plataformes, amb una indemnització total de 6 milions de dòlars. El veredicte, que apunta a mecanismes com recomanacions i scroll infinit, estableix un precedent que podria estendre la responsabilitat legal al disseny de sistemes digitals, inclosos futurs serveis basats en IA.

Ho explica Reuters

Un LLM amb més capacitat en ciberseguretat

Anthropic ha confirmat que està testant Claude Mythos, un model que descriu com “un salt qualitatiu” en raonament, codi i ciberseguretat. El sistema milloraria la detecció de vulnerabilitats i la simulació d’atacs en entorns controlats.

Informació filtrada per Fortune

Un model d’IA completa per primer cop un ciberatac complet

L’AI Security Institute del Regne Unit ha avaluat Claude Mythos Preview i mostra que és el primer model capaç de completar un cyber range end-to-end. L’avaluació també indica que resol el 73% de les proves CTF de nivell expert i que pot comprometre sistemes petits i vulnerables si disposa d’accés a xarxa, reforçant la necessitat de mesures bàsiques de ciberseguretat.

S’explica a AISI

Radiòlegs fallen davant radiografies falses generades amb IA

Un estudi mostra que radiòlegs de 12 centres i 6 països només van identificar correctament un 41% de les radiografies sintètiques quan no sabien que hi havia imatges falses; amb avís previ, la precisió va pujar al 75%. Publicat a Radiology

Agents d’IA poden enganyar en simulacions per assolir objectius

Diversos estudis experimentals mostren que models d’IA en entorns simulats poden ocultar informació o manipular resultats per evitar ser desactivats o protegir altres agents. Aquests comportaments no impliquen intencionalitat, sinó que emergeixen quan el sistema optimitza objectius definits sense control suficient.

Publicat a arXiv

Tecnologia

Un híbrid d’IA supera els models actuals en planificació robòtica

Un estudi compara models robòtics tipus VLA amb un sistema híbrid que combina percepció neuronal i planificació simbòlica. En la prova de Torres de Hanoi amb 3 blocs, el sistema híbrid arriba al 95% d’èxit davant del 34% del millor VLA; amb 4 blocs, resol el 78% dels casos mentre els VLA fracassen. El resultat reforça una idea simple: per a tasques que exigeixen planificar passos, la combinació de xarxes neuronals i lògica encara funciona millor que els models purament neuronals.

Paper publicat per Tufts University

Slack amplia Slackbot amb més capacitats d’IA

Slack ha anunciat més de 30 noves capacitats, incloent transcripció de reunions, coordinació d’agents, execució de tasques entre aplicacions i ús de context del desktop.

Anunci oficial de Slack

Dispositiu portàtil tradueix 40 llengües amb IA en temps real

Timekettle X1 permet traducció bidireccional simultània en 40 llengües i 93 accents mitjançant dos auriculars i un motor de processament en temps real.

Web de Timekettle

Model d’IA s’autooptimitza ajustant el seu propi entrenament

MiniMax presenta un model capaç d’analitzar errors, modificar el seu entorn d’execució i iterar sobre el seu propi procés d’aprenentatge. En proves internes, aquest enfocament ha mostrat millores de rendiment d’aproximadament un 30% en tasques específiques i automatitza fins al 50% dels fluxos de treball de recerca

Sobre el model m27

El CT de recompte de fotons millora la caracterització diagnòstica

GE HealthCare ha obtingut autorització de la FDA per al seu sistema Photonova Spectra, basat en tecnologia de recompte de fotons. A diferència del TAC convencional, permet mesurar cada fotó individualment i diferenciar millor materials com calci, contrast o teixits, augmentant la resolució i la informació diagnòstica en una sola exploració.

Ho publica GE Healthcare

Flux agentiu per desenvolupar software

Y Combinator ha publicat gstack, una configuració open source que converteix assistents de codi en un flux d’enginyeria amb rols separats com producte, arquitectura, desenvolupament, QA i documentació.

accés a GitHub

Cloudflare porta la memòria dels agents d’IA a producció

Cloudflare ha presentat Agent Memory, un servei que permet als agents recordar informació rellevant de converses anteriors sense carregar tot el context. Tot i que la memòria en IA no és nova, la novetat és oferir-la com a servei gestionat, facilitant agents més eficients i capaços de mantenir el fil en entorns reals.

S’explica al seu web

Un híbrid d’IA supera els models actuals en planificació robòtica

Paper publicat per Tufts University

Futurització

ARC-AGI-3 mostra els límits reals de la IA actual

El benchmark ARC-AGI-3, impulsat per la ARC Prize Foundation, avalua si la IA pot explorar entorns nous, inferir regles i adaptar-se sense instruccions prèvies. Mentre els humans resolen el 100% dels casos, els sistemes d’IA de frontera es mantenen per sota de l’1%, evidenciant limitacions en exploració, formulació d’hipòtesis i adaptació en situacions no conegudes.

S’explica a ARC Prize

La Xina fixa un full de ruta nacional per a la IA sanitària

La Comissió Nacional de Salut de la Xina ha publicat una directriu per impulsar i regular l’ús de la IA en tot el sistema sanitari. Abans de 2030, planteja cobertura gairebé total a l’atenció primària i ús generalitzat d’IA en imatge i suport clínic als hospitals de nivell secundari o superior.

Ho diu el govern xinès

Agents d’IA simulen deliberació per millorar decisions complexes

“Synthetic deliberation” és un model teòric on múltiples agents simulen perspectives diferents per explorar problemes complexos. Aquest enfocament permet preservar punts de vista divergents i controlar la seva integració, ampliant l’espai de solucions respecte al raonament individual.

Publicat a arXiv

Innex Digest Abril 26

Clínica

Frontera

Societat

Operacions

Regulació

Tecnologia

Futurització

Entrades recents

Comentaris