Hoppa till innehåll på sidan

Teknisk beskrivning av AI

Det finns ingen entydig eller allmänt vedertagen definition av AI. AI, maskininlärning och djupinlärning är begrepp som ofta används synonymt, men är inte samma sak.

AI är inte en särskild teknik utan definieras snarare utifrån utmärkande drag i kapaciteten eller funktionen. AI omfattar flera olika typer av tekniker och en av de teknikerna är maskininlärning. Djupinlärning är en form av maskininlärning som är uppbyggd på ett sätt som liknar den mänskliga hjärnans neuronnät.

Bilden visar hur de förhåller sig till varandra.

Vad är maskininlärning?

Maskininlärning kan beskrivas som förmågan hos ett system att lära sig av erfarenheter och efterlikna mänsklig intelligens.

Maskininlärning sker genom att en algoritm tränas med data (till exempel personuppgifter) och resulterar i en matematisk modell. Modellen används sedan för att statistiskt komma fram till det mest rimliga svaret när den ställs inför en fråga.

Maskininlärning är med andra ord processen där datorer utvecklar förmågan att lära sig och anpassa sig till en uppgift, utan att behöva programmeras specifikt för den uppgiften.

För att den matematiska modellen ska kunna lära sig behöver den erfarenhet, vilket den får av de data som den förses med. Vilka data som den tränas på beror på vilken uppgift som den ska kunna utföra. Sådana data kan innehålla personuppgifter.

Systemet kan fungera utan mänsklig inblandning och kan därmed självständigt skapa algoritmer. Resultatet blir en modell som kan dra slutsatser om okända data, som inte har ingått i träningen.

Maskininlärning sker vanligtvis på följande sätt:

  1. Stora mängder av data (till exempel texter) från utvalda källor väljs ut som träningsdata.
  2. Vid träning identifieras strukturer och återkommande mönster i datasetet.
  3. En modell skapas som kan behandla nya data och ge statistiskt rimliga slutsatser utifrån träningsdatasetet.

Då träningsdata sällan är desamma som de data som kommer att behandlas när modellen används för att utföra en uppgift, behöver den färdiga modellen i viss mån vara generell.

 

Exempel på maskininlärning

Exempel
  1. Ett stort antal bilder på djur väljs ut.
  2. Strukturer och mönster identifieras som motsvarar de olika arterna.
  3. Justering görs för att skilja på djurarter som liknar varandra, till exempel hästar och åsnor.
  4. En representativ modell skapas som kan användas för att identifiera olika arter i nya bilder som modellen inte har tränats på.

 

Vad är djupinlärning?

Djupinlärning är en typ av maskininlärning, där modellen byggs upp på ett sätt som liknar den mänskliga hjärnans neuronnät.

Vid djupinlärning byggs modellen upp på ett sätt som liknar den mänskliga hjärnans neuronnät. Det artificiella neuronnätet består av tre delar:

  • ett inlager ("input layer")
  • ett eller flera gömda lager ("hidden layer")
  • och ett utlager ("output layer").

Om det finns fler än ett gömt lager anses det vara fråga om djupinlärning. Hur många lager som modellen består av beror på hur mycket data modellen ska tränas på, och kan variera kraftigt.

Djupinlärningen sker genom att en algoritm förses med ett känt set med träningsdata och sedan lär sig att på egen hand utföra en uppgift. Det sker genom att algoritmen får en viss mängd indata och sedan producerar utdata. Indata kan till exempel vara en bild på ett föremål, och utdata kan vara svaret på vad bilden föreställer, det vill säga resultatet.

För indata anges ett värde för hur de ska viktas, det vill säga hur mycket indata som ska påverka slutresultatet (utdata). Ju mer indata algoritmen ska förses med, och som ska viktas, desto fler gömda lager kan behövas i modellen.

Värdet för viktningarna justeras under träningen för att ett så bra slutresultat som möjligt ska kunna uppnås. Det sker oftast genom att den arbetar bakåt i nätverket för att utföra justeringarna. På engelska kallas denna process för ”backpropagation”.

 

Träning av AI – data, metoder och resultat

Träningsdata är de data som används för att träna en AI-modell. Träningen av modellen kan ske genom olika träningsmetoder, och den färdigtränade AI-modellen kan sedan användas för att utföra en viss uppgift.

Träningsdata

Generellt sett gäller att ju mer träningsdata som en modell förses med, desto bättre blir den. Kvaliteten på data, och hur den lärs in i modellen, kan dock vara minst lika viktigt för resultatet. Vid träning av en modell är det viktigt att aktuella data är representativa för den uppgift som modellen ska kunna utföra. Vid övervakad inlärning har korrekt märkning av data också stor betydelse för att modellen ska fungera på ett ändamålsenligt sätt.

Olika träningsmetoder för AI

Vid maskininlärning, inklusive djupinlärning, kan träning av modellen ske genom övervakad inlärning (”supervised learning”), oövervakad inlärning (”unsupervised learning”) och förstärkningsinlärning (”reinforcement learning”).

Vid övervakad inlärning används märkta ("labeled") data, det vill säga data som innehåller det korrekta svaret. Träningsdata kan då till exempel bestå av bilder märkta med information om innehållet på bilden. Övervakad inlärning kan liknas vid hur ett barn lär sig namnet på föremål, såsom trädslag. Barnet kommer återkommande få berättat för sig vad ett föremål kallas, och så småningom kommer barnet att känna igen även andra bilar än just de bilar barnet har sett under inlärningen. På samma sätt används övervakad träning för att med märkta bilder träna modeller till att känna igen föremål.

Inför träningen delas data in i olika dataset, där ett dataset används för att träna modellen och ett annat dataset används för att testa hur väl modellen behandlar nya data. Om modellen är överanpassad till träningsdata ("overfitting") kommer den inte att fungera optimalt vid användning av nya data. Modellen behöver därför en viss grad av generalisering för att fungera effektivt när den förses med nya data.

Träning av en modell kan även ske genom oövervakad inlärning. Vid oövervakad inlärning används omärkta ("unlabeled") data, och istället för att modellen lär sig vad aktuella data föreställer, måste algoritmen själv hitta mönster i data utan förutbestämda svar. Aktuella data fördelas sedan i olika kluster.

Förstärkningsinlärning är en typ av maskininlärning där en algoritm lär sig att fatta optimala beslut genom att handlingarna värderas positivt eller negativt utifrån ett önskat slutresultat eller mål. Vid förstärkningsinlärning pågår träningen till dess att modellen har upptäckt vilka handlingar som leder till det önskade slutresultatet.


Exempel:
Förstärkningsinlärning kan användas vid träning av självkörande fordon. Eftersom att fordonet självmant förväntas justera hastighet och färdriktigt utifrån mål, omgivning/miljö och gällande trafikregler väljer vi att förstärka de handlingar vars slutresultat leder till att fordonet når sitt mål på ett säkert och effektivt sätt.

Metoderna används inte alltid strikt utan det förekommer även så kallad semiövervakad inlärning ("semi-supervised learning"). Semiövervakad inlärning är en inlärningsmetod som kombinerar element från både övervakad och oövervakad inlärning. Algoritmen använder en mindre mängd märkta data och en större mängd omärkta data för att lära sig och kunna förutspå resultatet.

 

Resultatet – den slutliga AI-modellen

Oavsett vilken träningsmetod eller algoritm som används vid maskininlärning, inklusive djupinlärning och förstärkningsinlärning, kommer resultatet att bli en modell som kan förses med data för att utföra en uppgift.

Modellen lagrar oftast inte träningsdata, utan består av en representation av de data som har använts under träningen. Det kan i vissa fall vara möjligt att återskapa data som har använts under träningen.

Modellen kan användas på två olika sätt, antingen statiskt eller dynamiskt.

Det ena sättet innebär att modellen är statisk, det vill säga den tränas till ett resultat och kommer sedan inte att förändras under användningen. En statisk modell fungerar alltså på samma sätt och producerar samma resultat under hela sin livscykel. Därmed uppnås större kontroll över modellen när den används.

En modell kan också vara dynamisk. Modellen används då på liknande sätt som den statiska modellen, men kan på egen hand använda data för att utvecklas och förbättras. Det innebär att modellen inte utvecklas och används i separata faser, utan simultant och beroende av varandra. Dynamiska modeller är svårare att kontrollera och förändringar av modellen har direkt effekt.

 

Läs den andra delen av vägledningen här: GDPR och AI

Senast uppdaterad: 16 april 2024