Hoppa till innehåll på sidan

Träning av AI – data, metoder och resultat

Träningsdata är de data som används för att träna en AI-modell. Träningen av modellen kan ske genom olika träningsmetoder, och den färdigtränade AI-modellen kan sedan användas för att utföra en viss uppgift.

Träningsdata

Generellt sett gäller att ju mer träningsdata som en AI-modell förses med, desto bättre blir den. Kvaliteten på data, och hur den lärs in i modellen, kan dock vara minst lika viktigt för resultatet. Vid träning av en modell är det viktigt att aktuella data är representativa för den uppgift som modellen ska kunna utföra.

När AI-modellen tränas genom övervakad inlärning har korrekt märkning av data också stor betydelse, för att modellen ska fungera på ett ändamålsenligt sätt.

Olika träningsmetoder för AI

Vid maskininlärning, inklusive djupinlärning, kan träning av modellen ske genom övervakad inlärning (”supervised learning”), oövervakad inlärning (”unsupervised learning”) och förstärkningsinlärning (”reinforcement learning”).

Vid övervakad inlärning används märkta (”labeled”) data, det vill säga data som innehåller det korrekta svaret. Träningsdata består till exempel av bilder märkta med information om innehållet på bilden.

Övervakad inlärning kan liknas vid hur ett barn lär sig namnet på föremål, såsom bilar. Barnet kommer återkommande få berättat för sig vad ett föremål kallas, och så småningom kommer barnet att känna igen även andra bilar än just de bilar barnet har sett under inlärningen. På samma sätt används övervakad träning för att med märkta bilder träna AI-modeller till att känna igen föremål.

Inför träningen delas data in i olika dataset, där ett dataset används för att träna AI-modellen och ett annat dataset används för att testa hur väl modellen behandlar nya data. Om modellen är överanpassad till träningsdata (”overfitting”) kommer den inte att fungera optimalt vid användning av nya data. AI-modellen behöver därför en viss grad av generalisering för att fungera effektivt när den förses med nya data.

Vid oövervakad inlärning används omärkta (”unlabeled”) data för att träna en AI-modell. Istället för att modellen lär sig vad aktuella data föreställer, måste algoritmen själv hitta mönster i data utan förutbestämda svar. Aktuella data fördelas sedan i olika kluster.

Förstärkningsinlärning är en typ av maskininlärning där en algoritm lär sig att fatta optimala beslut genom att olika handlingar värderas positivt eller negativt utifrån ett önskat slutresultat eller mål. Vid förstärkningsinlärning pågår träningen till dess att AI-modellen har upptäckt vilka handlingar som leder till det önskade slutresultatet.

Förstärkningsinlärning kan till exempel användas vid träning av självkörande fordon. Fordonet förväntas självmant justera hastighet och färdriktigt utifrån mål, omgivning/miljö och gällande trafikregler. Algoritmen kommer därför att förstärka de handlingar vars slutresultat leder till att fordonet når sitt mål på ett säkert och effektivt sätt.

De olika träningsmetoderna används inte alltid strikt, utan det förekommer även så kallad semiövervakad inlärning (”semi-supervised learning”).

Semiövervakad inlärning är en inlärningsmetod som kombinerar element från både övervakad och oövervakad inlärning. Algoritmen använder en mindre mängd märkta data och en större mängd omärkta data för att lära sig och kunna förutspå resultatet.

 

Resultatet – den slutliga AI-modellen

Oavsett vilken träningsmetod eller algoritm som används vid maskininlärning, inklusive djupinlärning och förstärkningsinlärning, kommer resultatet att bli en AI-modell som kan förses med data för att utföra en uppgift.

Modellen lagrar oftast inte träningsdata, utan består av en representation av de data som har använts under träningen. Det kan i vissa fall vara möjligt att återskapa data som har använts under träningen.

Modellen kan användas på två olika sätt, antingen statiskt eller dynamiskt.

Statisk AI-modell

När en AI-modell är statisk innebär det att den tränas till ett resultat. Den kommer sedan inte att förändras under användningen. En statisk modell fungerar alltså på samma sätt och producerar samma resultat under hela sin livscykel. Därmed uppnås större kontroll över modellen när den används.

Dynamisk AI-modell

En AI-modell som är dynamisk används på liknande sätt som den statiska modellen. Men den kan på egen hand använda data för att utvecklas och förbättras. Det innebär att modellen inte utvecklas och används i separata faser, utan simultant och beroende av varandra. Dynamiska modeller är svårare att kontrollera och förändringar av modellen har direkt effekt.

Läs mer av den tekniska beskrivningen

Vad är maskininlärning?

Vad är djupinlärning?

Senast uppdaterad: 13 juni 2024