「分類」是一個機器學習中很重要的概念
要好好學習機器學習需要兼具數學與理論能力。
機器學習的核心理念就是學一個函數。
例如1:圖片內容的分類,這是狗還是貓?
機器學習的input依然需要應用數據,因此會用一些方式將圖片數位化
例如2:客戶分析,這是好客戶還是壞客戶?
人的身高、性別、星座等等,都是可以數位化的特徵。
機器學習中,學函數的兩大方法「監督式學習」與「非監督式學習」
- 「監督式學習」Supervised Learning
- 指的是利用「知道答案」的歷史資料學習,我們讓機器像是練考古題一樣不斷練習,有點類似於迴歸分析也是如此,讓機器為我們找到箇中巧妙之處,一旦學會後就能用來預測它沒有學過的東西。
- 支持向量機 SVM (Support Vector Machine) 就是這種方式很重要的一種,它是一個用曲線把資料分隔的辦法,在高維度的時候自然就是曲面(超曲面)分隔資料的方法。實際舉例來說,它可以將一群二維的資料(散佈在X,Y坐標系上),並且我們將其標記,機器學習我們的分類方法,未來新的資料進入後便可以自行分類。
- 「非監督式學習」Unsupervised Learning
- 非監督式學習簡單來說就是我們「事先並不知道答案」。如果有一大筆我們不會分類的資料,透過這個方式可以讓機器為我們分類,我們只需要指定想分類的類別數。
- K-Means ( or k-means clustering)就是非監督式機器學習方式之一,在建築上經常用於對不規則曲面的區域分類,可以用在建築有理化產生可構築幾何(fabricable geometry)的過程中。
-「深度學習」
- 另外目前流行的人工智慧、深度學習,其核心理念也是分類與建立函數,方法則是另一種學習函數方式,往後另外討論。
留言
張貼留言
please leave a message