
Veckans AI-nyheter handlade om ett paradox: samtidigt som Claude lärde sig fjärrstyra din Mac och OpenAI skrotade sin videosatsning för att sprinta mot nästa stora modell, kom ARC-AGI-3 och påminde oss om att nutidens AI-giganter fortfarande snubblar på uppgifter ett barn kan lösa. Det är en vecka som sätter kapprustningens tempo i kontrast mot de grundläggande utmaningar som återstår.
Anthropic lanserade fjärrstyrning av datorn via Claude — skicka en uppgift från mobilen och låt Claude klicka sig igenom den på din Mac.
ARC-AGI-3 avslöjade att inte ett enda frontmodell klarar ens 1% av testet, med Gemini Pro som toppar på blygsamma 0,37%.
Wikipedia röstade 40–2 för att förbjuda AI från att skriva artiklar på den engelskspråkiga sajten.
OpenAI lade ner Sora och sin videoapp för att frigöra resurser till nästa modell, kodnamn "Spud."
Apple uppges testa en fristående Siri-app med chattbot-gränssnitt till iOS 27.
Anthropic har släppt en research preview som ger Claude direkt kontroll över ditt skrivbord — Claude kan klicka, skriva och navigera i appar på din Mac medan du sköter allt från telefonen via Dispatch.
Detaljerna:
Dispatch låter dig skicka en uppgift från mobilen och Claude slutför den på datorn i bakgrunden — synkat i samma konversationstråd.
Systemet undviker skärmstyrning när det går och letar först efter direkta app-integrationer och webbläsaråtkomst.
Funktionen är tillgänglig för macOS-användare på Pro- eller Max-plan via Cowork och Claude Code, med Windows-stöd på väg.
Bakom lanseringen ligger Vercept, ett startup inom datorstyrning som Anthropic förvärvade i februari — och det här är teamets första produktlansering efter bara fyra veckor.
Varför spelar det roll: "Framtiden där jag aldrig behöver öppna min laptop för att få saker gjorda blir verklig väldigt snabbt", sa Anthropics Alex Albert om lanseringen. För soloentreprenörer och frilansare är detta ett konkret steg mot en AI-assistent som faktiskt kan ta över repetitiva arbetsflöden — inte bara rådfrågas.
Wikipedias redigerare röstade med klar majoritet — 40 mot 2 — för att förbjuda AI från att skriva eller skriva om artiklar på den engelskspråkiga sajten.
Detaljerna:
Tidigare försök att nå konsensus om breda AI-regler misslyckades, men en växande mängd AI-genererade fel pressade redaktörerna till handling.
Förbudet täcker att skriva eller skriva om artiklar med hjälp av LLM:er, men tillåter fortfarande AI för grammatikfixar och översättningar med manuell granskning.
StackOverflow och tyska Wikipedia har liknande förbud, medan spanska Wikipedia gått längre och förbjudit AI även för redigering.
Politikens upphovsman beskrev beslutet som ett mothugg mot det han kallade "enshittification" och menar det kan inspirera gemenskaper på andra plattformar att sätta egna AI-regler.
Varför spelar det roll: AI-genererad text uppges ha passerat mänsklig text i volym under 2025, och Wikipedia försöker hålla den mänskliga linjen. Det är ett viktigt signalvärde — internets mest använda kunskapsbas väljer trovärdighet framför skalbarhet. Men hur länge det håller är en öppen fråga.
François Chollets ARC Prize Foundation lanserade ARC-AGI-3, den senaste versionen av sitt interaktiva resonemangstest — ett test där människor löser 100% av uppgifterna, men toppmodellerna knappt skrapar på 1%.
Detaljerna:
Testet består av 135 minispel med nästan 1 000 nivåer — alla mänskligt lösbara utan förkunskaper, men utan givna instruktioner eller regler.
Agenter måste på egen hand upptäcka regler, formulera mål och planera strategier från scratch.
Bäst bland frontmodellerna: Googles Gemini Pro på 0,37%, följt av GPT 5.4 High (0,26%), Opus 4.6 (0,25%) och Grok-4.20 (0%).
Varför spelar det roll: Det är nedslående att se världens bästa modeller tappa hela poängtavlan, men om tidigare ARC-AGI-versioner är någon guide är det ännu mer häpnadsväckande hur snabbt labbarna tar sig upp igen. Det Chollet vill ta reda på med V3 är om det är genuint resonemang eller bara dyrare "brute force" som driver framstegen.
OpenAI har stängt ner sin AI-videogenerator Sora — inklusive mobilapp och API — för att frigöra computing power till nästa stora modell med kodnamnet "Spud", som Sam Altman uppger är redo inom veckor.
Detaljerna:
Altman ska ha berättat för anställda att alla videoprodukter läggs ner, och de anställda beskrev Sora som en "belastning" på resurser.
Den frigjorda kapaciteten går till Spud, en modell Altman menar ska "verkligen kunna accelerera ekonomin".
Sora-teamets chef Bill Peebles sa att gruppen nu ska fokusera på "världssimulering" för robotik.
OpenAIs 1 miljard-dollar-avtal med Disney fryses som ett direkt resultat av nedstängningen.
Varför spelar det roll: Sora nådde App Store-toppen vid lanseringen — och skrotades ändå på under ett år. Det illustrerar tydligt var prioriteringarna faktiskt ligger: OpenAI vill vinna kapprustningen om nästa generations modell, inte plattformskrig om videoverktyg. Allt hänger nu på vad Spud faktiskt kan leverera.
Apple uppges testa en fristående Siri-app parallellt med en ny "Ask Siri"-upplevelse — båda planerade för debut på WWDC i juni som en del av iOS 27.
Detaljerna:
Siri ska för första gången få en dedikerad app, med ett omdesignat gränssnitt för text- eller röstfrågor.
Assistenten ska kunna läsa igenom iMessages, e-post och anteckningar för att bygga sammanhang, och direkt utföra åtgärder i tredjepartsappar.
Apple kallar upplevelsen "Ask Siri" — en chattbot-stil som ersätter de stela röstkommandon man känt sedan länge.
Hela lanseringen väntas på WWDC den 8 juni som en del av iOS 27 och macOS 27, efter ett svalt mottagande av Apple Intelligence förra året.
Varför spelar det roll: Apple Intelligence misslyckades med att imponera — det här är sannolikt sista chansen att definiera Siri innan användarna permanent byter till ChatGPT eller Claude för allt. Den 8 juni är den viktigaste keynoten på år, men det räcker inte med bra demos: det behövs ett faktiskt fungerande system i händerna på användarna.
AI Guide
Frigör lagringsutrymme med Claude
Här är ett enkelt sätt att använda Claude som din städassistent.
Steg för steg:
Starta Claude eller Claude Code och skriv: "I need to free up Mac storage, but I don't want to delete anything important. Ask me about my tools, find storage culprits, and help me investigate before suggesting any cleanup commands"
Svara på frågorna och be Claude ranka bovarna efter storlek och risk — du får terminalkommandon för att kontrollera de värsta syndarna.
Jobba dig igenom varje kategori: be Claude förklara vad filerna är, varför de växer, vad som är säkert att ta bort och vad som bör granskas manuellt.
När du identifierat dem, skriv: "Start with the lowest-risk cleanup wins first. For each one, explain what would be removed, how much space it might save, and anything I should double-check before deleting it"
Proffstips: Låt Claude förklara varför en mapp växer, inte bara visa storleken. Det ger dig en modell för att undvika problemet i framtiden.
Extra: verktyg, arbetsflöden och länkar
🎶 Lyria 3 Pro — Googles uppgraderade AI-musikmodell som nu genererar spår upp till 3 minuter (upp från 30 sekunder). Tillgänglig i Gemini och AI Studio.
🚀 Stitch — Googles uppdaterade UI-verktyg för "vibe design" — ladda upp en skärmdump och generera omdesignade layouter att exportera till Figma eller kod.
🎨 Uni-1 — Luma Labs enhetliga modell som resonerar och genererar text och bilder i en och samma pipeline. Toppar preferensrankningar för stil och redigeringsarbete.
🌌 Galaxy — Världens främsta allt-i-ett-AI-plattform med över 5 000 AI-modeller och verktyg samlat på ett ställe.
💰 OpenAI tar in ytterligare $10 miljarder — Rundan drar mot $120 miljarder totalt med Microsoft, a16z och T. Rowe Price som nya investerare.
🖌️ Figma öppnar canvas för agenter — Verktyg som Claude Code kan nu skapa och redigera designs direkt på Figmas canvas med ett teams befintliga komponenter och varumärkesstandard.
