機器學習 NOTE - 「監督式學習」與「非監督式學習」


「分類」是一個機器學習中很重要的概念

要好好學習機器學習需要兼具數學與理論能力。

機器學習的核心理念就是學一個函數。


    例如1:圖片內容的分類,這是狗還是貓?

    機器學習的input依然需要應用數據,因此會用一些方式將圖片數位化

https://data-flair.training/blogs/cats-dogs-classification-deep-learning-project-beginners/


    例如2:客戶分析,這是好客戶還是壞客戶?

    人的身高、性別、星座等等,都是可以數位化的特徵。


機器學習中,學函數的兩大方法「監督式學習」與「非監督式學習」


- 「監督式學習」Supervised Learning

    - 指的是利用「知道答案」的歷史資料學習,我們讓機器像是練考古題一樣不斷練習,有點類似於迴歸分析也是如此,讓機器為我們找到箇中巧妙之處,一旦學會後就能用來預測它沒有學過的東西。

    - 支持向量機 SVM (Support Vector Machine) 就是這種方式很重要的一種,它是一個用曲線把資料分隔的辦法,在高維度的時候自然就是曲面(超曲面)分隔資料的方法。實際舉例來說,它可以將一群二維的資料(散佈在X,Y坐標系上),並且我們將其標記,機器學習我們的分類方法,未來新的資料進入後便可以自行分類。

https://scikit-learn.org/stable/modules/svm.html

- 「非監督式學習」Unsupervised Learning

    - 非監督式學習簡單來說就是我們「事先並不知道答案」。如果有一大筆我們不會分類的資料,透過這個方式可以讓機器為我們分類,我們只需要指定想分類的類別數。

    - K-Means ( or k-means clustering)就是非監督式機器學習方式之一,在建築上經常用於對不規則曲面的區域分類,可以用在建築有理化產生可構築幾何(fabricable geometry)的過程中。


https://rpubs.com/cyobero/k-means


-「深度學習」

   -  另外目前流行的人工智慧、深度學習,其核心理念也是分類與建立函數,方法則是另一種學習函數方式,往後另外討論。

留言