Kinas hemliga AI-vapen som får Silicon Valley att vackla

Kina använder nyårsfirandet som AI-skyltfönster

Medan fyrverkerier lyser upp himlen över Kina under nyårsfirandet, tänder de stora teknikjättarna sina egna digitala fyrverkerier. Nya AI-modeller från Peking, Hangzhou och Shenzhen närmar sig ChatGPT, Gemini och liknande system så pass nära att till och med OpenAI-chefen Sam Altman börjar fundera. Frågan ställer sig naturligt: Hur länge kan Silicon Valley egentligen behålla sin dominans inom artificiell intelligens?

Det kinesiska nyåret handlade i år inte bara om traditioner — det var också en teknologisk demonstration. Vid officiella shower dansade humanoida robotar i perfekt synkronisering sida vid sida med människor. Budskapet var tydligt: Kina vill inte längre betraktas som eftersläpare inom robotteknologi och artificiell intelligens.

Parallellt släppte landets stora teknikbolag en ny våg av AI-modeller som täcker praktiskt taget alla centrala områden inom aktuell AI-utveckling — från videogeneratorer över multimodala chatbottar till högt specialiserade programmeringsassistenter.

Det amerikanska embargot som oavsiktlig drivkraft

Paradoxalt nog är det just den amerikanska politiken som har accelererat denna utveckling. Washington har infört massiva restriktioner på export av avancerade AI-chips till Folkrepubliken. Syftet var att bromsa Kinas AI-ambitioner — men i praktiken sker ofta det motsatta.

Medan USA försökte bromsa Kina med chipexportförbud, tvingar detta tryck just de kinesiska företagen till radikal effektivitet — med märkbara resultat i både tempo och kostnader.

Medan koncerner som OpenAI, Google och Meta bygger enorma datacenter fyllda med Nvidia-chips, tvingas kinesiska utvecklare arbeta med betydligt mer begränsade resurser. Det tvingar dem till nya angreppssätt: strömlinjeformade arkitekturer, optimerade träningsmetoder och alternativ till amerikansk hårdvara.

Ett konkret exempel är användningen av Huawei Ascend-chips för stora språkmodeller. Dessa halvledare kommer inte från USA, men är nu starka nog att träna toppmodeller. Den som arbetar effektivt med dem minskar sina kostnader markant — en strategisk fördel i den globala konkurrensen.

Sam Altman uttalade i en intervju med CNBC att Kinas tempo var ”anmärkningsvärt”. Att en topchef från USA berömmer sin konkurrent så öppet avslöjar hur allvarligt Silicon Valley tar den nya rivaliteten.

Öppen källkod som trumfkort: Kinas satsning på öppna modeller

Något som faller många europeiska användare positivt i ögonen är att en stor del av de nya kinesiska modellerna släpps som öppen källkod- eller open weight-varianter.

  • Öppen källkod: Källkod, modellarkitektur och ofta även träningsdata är offentligt tillgängliga.
  • Open Weight: Modellens vikter kan laddas ner fritt, medan den bakomliggande koden delvis förblir proprietär.

Båda tillvägagångssätten har en sak gemensamt: Modellerna kan köras lokalt, på egna servrar eller till och med på kraftfulla arbetsstationer. Företag behåller därmed full kontroll över sina data utan att skicka dem till amerikanska plattformar eller kinesiska molnleverantörer.

För många företag i Tyskland är dataskydd den avgörande punkten: En stark modell som körs helt i eget datacenter verkar plötsligt mer attraktiv än ett marginellt bättre amerikanskt molnsystem.

Det är precis det många kinesiska leverantörer siktar mot. De kombinerar höga prestandavärden med möjligheten att ladda ner, anpassa och säkra modellen internt. För utvecklargemenskaper är det en gåva — för amerikanska koncerner är det ett hot mot deras licens- och API-affär.

Spektakulära videor: Seedance 2.0 gör Hollywood nervöst

Särskild uppmärksamhet fick till nyår videomodellen Seedance 2.0 från TikTok-koncernen ByteDance. De genererade klippen framstår som korta filmscener med avancerade kamerarörelser och övertygande karaktärer — markant närmare bionivå än tidigare försök.

Seedance 2.0 skiljer sig från den kinesiska vågen genom att inte vara fritt tillgängligt. Varken kod eller vikter kan laddas ner, och det förblir en klassisk proprietär produkt. Å andra sidan skapar det redan juridiska friktion: Disney, Paramount och Netflix anklagar ByteDance för möjliga upphovsrättsintrång. Misstanken är att modellen i hög grad tränats på skyddat filmmaterial.

För branschen är det en varningssignal. Ju mer realistiska generativa videor blir, desto högre ropar studior, regissörer och fackföreningar om rättvisa träningsdata, skydd av varumärken och potentiella jobbförluster. Trots detta visar Seedance 2.0 tydligt: Kina spelar med i den absoluta superligan inom video-AI.

Qwen, GLM, DeepSeek och Kimi: den nya kinesiska AI-armadan

Qwen3.5: Alibabas multimodala mångsidighet

Alibaba satsar med Qwen3.5 på en stor vision-language-modell som förstår och kombinerar text, bilder och video. Chatbotten känner igen innehåll på omkring 200 språk och kan fungera som ”agent” i formulär, på webbplatser eller i interna verktyg — exempelvis för att automatisera arbetsflöden.

Qwen3.5 är tillgängligt under fri licens på plattformar som GitHub. Utvecklare kan integrera modellen i egna produkter, finjustera den eller köra den i sin egen infrastruktur. För Alibaba är det samtidigt ett sätt att binda globala AI-ekosystem till deras eget moln.

GLM-5 från Zhipu AI: optimerad för agenter och komplex resonemang

Modellen GLM-5, presenterad av Zhipu AI, riktar sig särskilt till utvecklare och företag som vill bygga självständiga AI-agenter. Enligt företaget ligger fokus på flerstegigt logiskt resonemang, precis planering och robust problemlösning.

Tekniskt intressant är användningen av DeepSeek Sparse Attention (DSA). Denna teknik begränsar modellens uppmärksamhet till relevanta delar av kontexten, vilket minskar beräkningsbördan utan att märkbart kompromissa med kvaliteten. GLM-5 är fullt ut tränad på Huawei Ascend-chips, vilket understryker oberoende av amerikansk hårdvara.

DeepSeek V4: kinesisk utmanare till GPT och Claude

Det finns särskild spänning kring den kommande versionen av DeepSeek-modellen. Föregångaren DeepSeek V3 skapade redan uppseende genom att i många benchmark närma sig ChatGPT — men till betydligt lägre träningskostnader.

Den kommande V4-versionen ska enligt branschmedieresearch särskilt briljera inom programmeringsuppgifter. I vissa benchmark förväntas DeepSeek V4 överträffa de nuvarande GPT-modellerna från OpenAI och Claude från Anthropic. Lyckas det i praktiken kommer en kinesisk kodassistent vara redo att avlasta utvecklare världen över.

Kimi K2.5 från Moonshot AI: specialisering framför gigantism

Moonshot AI följer med sin modell Kimi K2.5 ett tillvägagångssätt som är känt från Google Gemini 3.0: Mixture of Experts (MoE). Här delas den stora språkmodellen upp i flera specialiserade delnätverk, och en router avgör för varje förfrågan vilka expertdelar som aktiveras.

Denna struktur sparar beräkningskraft eftersom inte hela modellen arbetar på full styrka vid varje input. Vissa experter concentrerar sig på programmering, andra på språkförståelse, och ytterligare andra på matematiska uppgifter eller kreativt skrivande.

  • Fördel: Lägre energiförbrukning per förfrågan
  • Fördel: Målmedveten optimering av de enskilda experterna är möjlig
  • Risk: Mer komplex arkitektur som är svårare att felsöka

Prestandaklyftan krymper — och kanske vänder om

Än så länge levererar ChatGPT, Gemini och andra amerikanska modeller fortfarande marginellt bättre resultat i många benchmark. Men försprånget har krympt avsevärt och är nu ofta bara synligt när man dyker djupt ner i testtabeller. I praktiken räknas andra faktorer för företag: kostnader, kontroll, anpassningsförmåga och juridisk säkerhet.

En bara marginellt svagare modell som körs lokalt och utan datautflöde kan för medelstora företag vara mer attraktiv än den glänsande molntjänsten från Kalifornien.

Särskilt i Europa, där dataskyddslagstiftningen är sträng, kan kinesiska öppen källkod-modeller fylla en viktig nisch. Företag laddar ner vikterna, kör dem på egen hårdvara eller hos lokala hostingleverantörer och håller känsliga uppgifter internt. Detta perspektiv förskjuter maktbalansen på den globala AI-marknaden.

Vad begrepp som ”open weight” och ”agent-AI” egentligen betyder

Många av de tekniska termerna kring de nya modellerna låter abstrakta, men rör mycket konkreta tillämpningar. ”Open weight” betyder till exempel att de rena vikterna från det tränade nätverket är fritt tillgängliga. Det ger utvecklare möjlighet att:

  • finjustera modellen på egna data,
  • använda den i offline-miljöer, exempelvis i isolerade nätverk,
  • förbli oberoende av den ursprungliga leverantören, så länge licensen tillåter det.

”Agent-AI” betecknar system som inte bara besvarar frågor, utan självständigt planerar och utför handlingar: genomsöker dokument, fyller i formulär, styr externa verktyg. Det är precis här Qwen3.5 och GLM-5 positionerar sig — inte bara som chatbottar, utan som aktiva hjälpare som arbetar i bakgrunden, från bokföring till mjukvaruutveckling.

Möjligheter och risker för DACH-regionen

För företag i det tyskspråkiga området — inkluderat Tyskland, Österrike och Schweiz — öppnar denna utveckling nya möjligheter, men medför också osäkerhet. På möjlighetssidan står billigare alternativ till amerikanska tjänster, större teknologisk mångfald och chansen att bygga egen AI-infrastruktur utan att vara totalt beroende av en leverantör.

På risksidan finns geopolitiska spänningar, möjliga exportrestriktioner på AI-programvara samt juridiska frågor om ansvar, upphovsrätt och dataanvändning. Företag som använder kinesiska modeller bör noggrant undersöka under vilken licens de är utgivna och hur de har tränats.

I praktiken kan ett hybridtillvägagångssätt löna sig för många företag: kritiska applikationer på lokalt drivna open weight-modeller, kreativa eller icke-känsliga användningsfall fortsatt via molnerbjudanden som ChatGPT. På så sätt fördelas risken, och team bygger upp erfarenhet av båda världar — medan avståndet mellan Kina och Silicon Valley dag för dag blir lite mindre.

Rulla till toppen