Maskininlärning ("machine learning") är ett område inom artificiell intelligens. Det är metoder för att med data "träna" datorer att upptäcka och "lära" sig regler för att lösa en uppgift, utan att datorerna har programmerats med regler för just den uppgiften. Området angränsar till statistik, datorseende och mönsterigenkänning.
Datautvinning ("datamining") är ett närliggande område som använder liknande statistiska metoder. Skillnaden är att maskininlärning ger förutsägelser som baseras på kända egenskaper genom att tränas på datat, medan datautvinning fokuserar på att upptäcka okända egenskaper i datat.
En definition av maskininlärning har skapats av Tom Mitchell, som definierar de algoritmer som studeras inom maskininlärning som "ett datorprogram sägs lära av erfarenhet E givet en uppgift T och ett prestandamått P om dess prestanda på uppgiften T, mätt med P, ökar med erfarenhet E".
Problem inom maskininlärning delas ofta in i två större kategorier, beroende på situationen de används i:
För att exemplifiera denna typ av inlärning, föreställ dig en maskininlärningsmodell avsedd att fungera som ett skräppostfilter, det vill säga modellen är avsedd att känna igen och filtrera bort skräppost. Om denna modell tränas genom väglett lärande består träningsdatan av en mängd e-postmeddelanden, där varje e-postmeddelande är markerad som antingen "skräppost" eller "inte skräppost". Förutsatt att modellen tränas på rätt sätt med representativ data så kommer modellen lära sig att förutspå om ett tidigare osett e-postmeddelande bör markeras som "skräppost" eller inte.
Till dessa två kategorier läggs ofta en tredje kategori:
Agentens mål är att maximera en (viktad) summa av erhållna belöningar, vilket åstadkoms genom att denna väljer handlingar dels för att öka kunskapen om vilka handlingar som medför vilka belöningar (till kostnaden av att de direkta belöningarna kan bli små), och dels genom att utnyttja tidigare erfarenheter av vilka handlingar som ger stora belöningar. Denna avvägning i valet av agerande brukar kallas utforskande-utnyttjande-avvägningen.
En annan kategorisering av maskininlärning får man beroende på vilket format utdatan har:
En modell för maskininlärning är en typ av matematisk modell som kan "tränas" på en given datamängd för att göra förutsägelser eller klassificeringar av nytt data. Vid träningen anpassar en algoritm modellens parametrar iterativt för att minimera avvikelserna i dess förutsägelser.
Det finns flera modeller att välja mellan. Några av de vanligaste:
källa: en.wikipedia.org/wiki/Machine_Learning
Sidan skapad 18 mars 2025
Sammanställt av Christer Tärning.