Innex Digest Abril 26
- Josep Mª Monguet Fierro
- Apr 20
- 8 min de lectura

Clínica
LLMs fallen clínicament malgrat superar benchmarks de seguretat
Un estudi amb models com GPT-4o i Llama 3.1 mostra que, tot i complir criteris de seguretat, fallen en fins a un 20% de respostes en contextos de salut mental. En comparació, terapeutes humans responen adequadament en el 93% dels casos. Els resultats indiquen que els benchmarks actuals mesuren evitar danys però no qualitat clínica real.
Publicat a arXiv
Un model clínic prediu com serà la següent visita amb dades longitudinals
Un model entrenat amb més d’un milió de pacients utilitza històries clíniques electròniques seqüencials per predir els esdeveniments de la següent visita.
Publicat a arXiv
La Xina aprova el primer BCI comercial per a paràlisi
S’ha autoritzat el primer sistema d’interfície cervell-ordinador disponible per a persones amb tetraplegia per lesió medul·lar cervical. El dispositiu capta la intenció de moviment i la tradueix en ordres per a un guant robòtic que ajuda a recuperar la prensió de la mà.
Publicat a Reuters
MetaLens amb IA permet ecografia a través de les costelles
Investigadors de la University of Hong Kong han desenvolupat una lent basada en metamaterials i IA que permet visualitzar en temps real estructures cardíaques fins a aproximadament 10 cm darrere de la caixa toràcica. El sistema podria substituir parcialment proves amb radiació com el TC en entorns crítics com urgències o UCI.
Ho explica la University of Hong Kong
IA prediu demanda hospitalària amb dades clíniques i calendari
Amb prop de 200.000 visites pediàtriques en 9 hospitals un model d’IA pot anticipar la demanda amb un error del 8,71% a 24 h i del 9,18% a 7 dies. Les variables més determinants són calendari i motius de consulta. Publicat a Intelligence-Based Medicine
Frontera
Model d’IA prediu activitat cerebral amb dades multimodals
TRIBE és un model que prediu patrons d’activació cerebral mesurats amb fMRI a partir de vídeo, àudio i text. El sistema permet simular respostes neuronals in silico i explorar la relació entre estímuls i activitat cerebral. Es tracta d’una validació experimental encara sense aplicació clínica directa.
Ho explica Meta
Xiaomi també prova robots humanoides en una fàbrica de vehicles
Segons el president de la companyia, dos robots humanoides han completat prop del 90% de les tasques assignades dins la seva planta de vehicles elèctrics.
Declaracions a Xiaomi
La IA ajuda… però pot fer perdre habilitats clíniques
Tot i millorar l’eficiència, la IA pot afavorir dependència i erosió de competències mèdiques. En colonoscòpia, la detecció d’adenomes va baixar del 28,4% al 22,4% en retirar la IA; en radiologia, errors del sistema van augmentar falsos positius fins al 12%; i en patologia, més del 30% dels professionals van canviar diagnòstics correctes sota pressió.
Publicat com a Scoping review
La IA pot externalitzar també les nostres creences
Un treball descriu el “belief offloading”: el moment en què la IA deixa de ser només una ajuda cognitiva i passa a influir en la formació, manteniment i revisió de les creences, normes i comportaments.
Article a arXiv
Societat
Un de cada tres adults ja consulta IA per temes de salut
Una enquesta de KFF indica que el 32% dels adults als EUA han utilitzat eines d’IA durant l’últim any per obtenir informació o consell sobre salut i el 41% dels usuaris hi han pujat dades mèdiques personals.
Enquesta completa a KFF
Experts i població discrepen sobre l’impacte de la IA
L’informe 2026 de Stanford HAI mostra que el 73% dels experts en IA veuen positivament el seu impacte en el treball, mentre només el 23% de la població general comparteix aquesta visió. Aquesta bretxa evidencia una desalineació rellevant entre desenvolupament tecnològic i percepció social, amb implicacions directes per a l’adopció de la IA en entorns clínics i professionals.
Estudi de Hai.Stanford
Wiquipedia veta l’ús de LLM per escriure articles
La Viquipèdia en anglès ha formalitzat una norma que prohibeix usar models de llenguatge per generar o reescriure contingut d’articles, amb excepcions limitades per a correcció bàsica del propi text i traducció sota verificació humana.
Política oficial de Wiquipedia
S’obre un mapa de professions exposades a la IA
Una eina puntua 342 ocupacions del Occupational Outlook Handbook del BLS segons la seva exposició digital a la IA i les visualitza en un mapa interactiu.
Projecte de Karpathy
El consum massiu de tokens d’IA revela límits de cost
L’ús intensiu de models d’IA dins grans empreses com Meta comença a evidenciar un límit econòmic. Un empleat hauria consumit 328,5 mil milions de tokens en 30 dies, una xifra que hauria equivalgut a gairebé 2 milions de dòlars segons preus públics dels models. Aquest cas apunta a un canvi de fase: de l’adopció accelerada de la IA cap a la necessitat de control i optimització del cost.
S’explica a The Information
Operacions
NVIDIA impulsa models oberts frontier amb una nova coalició
La Nemotron Coalition uneix vuit laboratoris d’IA per desenvolupar models frontier oberts. El primer projecte serà un model base co-desenvolupat amb Mistral AI, orientat a alimentar la futura família Nemotron 4 i ampliar l’accés a models avançats fora dels grans sistemes tancats.
Notícia de Nvidia
Tufts estima 9,3 milions de feines vulnerables a la IA
L’American AI Jobs Risk Index de Tufts calcula que 9,3 milions de llocs de treball als EUA podrien quedar exposats a desplaçament per IA en els pròxims 2 a 5 anys. L’informe assenyala que el risc es concentra en ocupacions cognitives i ben remunerades, com programació, escriptura i anàlisi, més que no pas en feines manuals.
Publicat a Tufts
Aplicació de la IA per optimitzar assaigs clínics
Novo Nordisk afirma que ja utilitza IA per identificar subpoblacions de pacients, millorar el disseny dels assaigs i seleccionar centres. El treball s’alimenta de dades harmonitzades d’uns 1.600 assaigs clínics.
Segons la Memòria Anual 2024
La IA escurça el prototipat de mesos a dies
L’ús d’eines d’IA generativa permet construir prototips funcionals en dies en lloc de setmanes o mesos, segons reportatges recents sobre pràctiques en startups. Aquest canvi redueix la dependència de processos tradicionals de desenvolupament i accelera la iteració inicial de producte.
Reportatge a The Information
La consultoria adapta el model de negoci en el context de la IA
PwC US està reconfigurant els seus serveis professionals amb la plataforma PwC One i preus basats en subscripció o consum, en lloc del model clàssic d’hores facturades. El canvi mostra com la IA no només automatitza tasques, sinó que comença a alterar el model de negoci de la consultoria i el tipus de talent que aquestes firmes necessiten.
Notícia a PwC
Shopify obre la porta a agents d’IA operant botigues
Shopify ha llançat un AI Toolkit que permet connectar agents d’IA com Claude o Codex directament amb botigues reals mitjançant APIs oficials. A diferència dels usos anteriors, els agents poden executar accions com crear productes, modificar preus o gestionar inventari dins l’entorn productiu. Aquest canvi marca el pas de la IA com a assistent a la IA com a operador en sistemes digitals.
Ho explica Shopify
Regulació
Un jurat vincula disseny digital amb dany en salut mental
Un jurat als EUA ha determinat que Meta i YouTube són responsables de danys en salut mental associats al disseny addictiu de les seves plataformes, amb una indemnització total de 6 milions de dòlars. El veredicte, que apunta a mecanismes com recomanacions i scroll infinit, estableix un precedent que podria estendre la responsabilitat legal al disseny de sistemes digitals, inclosos futurs serveis basats en IA.
Ho explica Reuters
Un LLM amb més capacitat en ciberseguretat
Anthropic ha confirmat que està testant Claude Mythos, un model que descriu com “un salt qualitatiu” en raonament, codi i ciberseguretat. El sistema milloraria la detecció de vulnerabilitats i la simulació d’atacs en entorns controlats.
Informació filtrada per Fortune
Un model d’IA completa per primer cop un ciberatac complet
L’AI Security Institute del Regne Unit ha avaluat Claude Mythos Preview i mostra que és el primer model capaç de completar un cyber range end-to-end. L’avaluació també indica que resol el 73% de les proves CTF de nivell expert i que pot comprometre sistemes petits i vulnerables si disposa d’accés a xarxa, reforçant la necessitat de mesures bàsiques de ciberseguretat.
S’explica a AISI
Radiòlegs fallen davant radiografies falses generades amb IA
Un estudi mostra que radiòlegs de 12 centres i 6 països només van identificar correctament un 41% de les radiografies sintètiques quan no sabien que hi havia imatges falses; amb avís previ, la precisió va pujar al 75%. Publicat a Radiology
Agents d’IA poden enganyar en simulacions per assolir objectius
Diversos estudis experimentals mostren que models d’IA en entorns simulats poden ocultar informació o manipular resultats per evitar ser desactivats o protegir altres agents. Aquests comportaments no impliquen intencionalitat, sinó que emergeixen quan el sistema optimitza objectius definits sense control suficient.
Publicat a arXiv
Tecnologia
Un híbrid d’IA supera els models actuals en planificació robòtica
Un estudi compara models robòtics tipus VLA amb un sistema híbrid que combina percepció neuronal i planificació simbòlica. En la prova de Torres de Hanoi amb 3 blocs, el sistema híbrid arriba al 95% d’èxit davant del 34% del millor VLA; amb 4 blocs, resol el 78% dels casos mentre els VLA fracassen. El resultat reforça una idea simple: per a tasques que exigeixen planificar passos, la combinació de xarxes neuronals i lògica encara funciona millor que els models purament neuronals.
Paper publicat per Tufts University
Slack amplia Slackbot amb més capacitats d’IA
Slack ha anunciat més de 30 noves capacitats, incloent transcripció de reunions, coordinació d’agents, execució de tasques entre aplicacions i ús de context del desktop.
Anunci oficial de Slack
Dispositiu portàtil tradueix 40 llengües amb IA en temps real
Timekettle X1 permet traducció bidireccional simultània en 40 llengües i 93 accents mitjançant dos auriculars i un motor de processament en temps real.
Web de Timekettle
Model d’IA s’autooptimitza ajustant el seu propi entrenament
MiniMax presenta un model capaç d’analitzar errors, modificar el seu entorn d’execució i iterar sobre el seu propi procés d’aprenentatge. En proves internes, aquest enfocament ha mostrat millores de rendiment d’aproximadament un 30% en tasques específiques i automatitza fins al 50% dels fluxos de treball de recerca
Sobre el model m27
El CT de recompte de fotons millora la caracterització diagnòstica
GE HealthCare ha obtingut autorització de la FDA per al seu sistema Photonova Spectra, basat en tecnologia de recompte de fotons. A diferència del TAC convencional, permet mesurar cada fotó individualment i diferenciar millor materials com calci, contrast o teixits, augmentant la resolució i la informació diagnòstica en una sola exploració.
Ho publica GE Healthcare
Flux agentiu per desenvolupar software
Y Combinator ha publicat gstack, una configuració open source que converteix assistents de codi en un flux d’enginyeria amb rols separats com producte, arquitectura, desenvolupament, QA i documentació.
accés a GitHub
Cloudflare porta la memòria dels agents d’IA a producció
Cloudflare ha presentat Agent Memory, un servei que permet als agents recordar informació rellevant de converses anteriors sense carregar tot el context. Tot i que la memòria en IA no és nova, la novetat és oferir-la com a servei gestionat, facilitant agents més eficients i capaços de mantenir el fil en entorns reals.
S’explica al seu web
Un híbrid d’IA supera els models actuals en planificació robòtica
Un estudi compara models robòtics tipus VLA amb un sistema híbrid que combina percepció neuronal i planificació simbòlica. En la prova de Torres de Hanoi amb 3 blocs, el sistema híbrid arriba al 95% d’èxit davant del 34% del millor VLA; amb 4 blocs, resol el 78% dels casos mentre els VLA fracassen. El resultat reforça una idea simple: per a tasques que exigeixen planificar passos, la combinació de xarxes neuronals i lògica encara funciona millor que els models purament neuronals.
Paper publicat per Tufts University
Futurització
ARC-AGI-3 mostra els límits reals de la IA actual
El benchmark ARC-AGI-3, impulsat per la ARC Prize Foundation, avalua si la IA pot explorar entorns nous, inferir regles i adaptar-se sense instruccions prèvies. Mentre els humans resolen el 100% dels casos, els sistemes d’IA de frontera es mantenen per sota de l’1%, evidenciant limitacions en exploració, formulació d’hipòtesis i adaptació en situacions no conegudes.
S’explica a ARC Prize
La Xina fixa un full de ruta nacional per a la IA sanitària
La Comissió Nacional de Salut de la Xina ha publicat una directriu per impulsar i regular l’ús de la IA en tot el sistema sanitari. Abans de 2030, planteja cobertura gairebé total a l’atenció primària i ús generalitzat d’IA en imatge i suport clínic als hospitals de nivell secundari o superior.
Ho diu el govern xinès
Agents d’IA simulen deliberació per millorar decisions complexes
“Synthetic deliberation” és un model teòric on múltiples agents simulen perspectives diferents per explorar problemes complexos. Aquest enfocament permet preservar punts de vista divergents i controlar la seva integració, ampliant l’espai de solucions respecte al raonament individual.
Publicat a arXiv



Comentaris