書名：機器學習入門｜從玻爾茲曼機器學習到深度學習

原文書名：

產品代碼：
9789864767779
系列名稱：
資料庫/大數據
系列編號：
ACD015500
定價：
380元
作者：
大?真之
譯者：
許郁文
頁數：
240頁
開數：
17x23
裝訂：
平裝
上市日：
20180418
出版日：
20180418
出版社：
?峰資訊股份有限公司
CIP：
略
市場分類：
電腦資訊
產品分類：
書籍免稅
聯合分類：
電腦資訊類
※在庫量小

商品簡介

用最親切的方式，告訴你機器學習到底是在學什麼

．日本IT技術書部門大賞2018年得獎作品
．以輕鬆有趣的對話方式進行，沒有艱澀難懂的文字
．用生活化的譬喻解說機器學習的原理
．簡單易懂的插圖解說，非專業人士也能藉由本書理解機器學習

機器學習正處於不斷演化的階段，本書將介紹玻爾茲曼機器學習與深度學習。什麼是「玻爾茲曼機器學習」呢？舉個例子來說，即使是有點模糊或部分被遮住的圖片，人類也能立刻了解圖片的內容，這是因為人類能斟酌過去的經驗與現在的狀況，了解圖片的內容。所謂的「玻爾茲曼機器學習」，就是讓電腦也能得到這種能力的方法。也就是為電腦打造眼睛與腦部記憶的構造。深度學習則是在這項技術加上腦部判斷能力，讓電腦根據周遭的情況做出「這個是這樣，那個是之前看過的那個」的判斷技術。即使您從未接觸過「機器學習」的知識，也能藉由本書建立基本的概念。

目錄
第1章｜什麼都不懂的鏡子
1.1 魔鏡與皇后
1.2 試著機械學習
Column　機械學習是什麼？
1.3 根據資料學習
Column　機械的自主學習

第2章｜美麗的祕訣
2.1 魔鏡的答案
Column　數學的必要性
2.2 挑戰迴歸問題
Column　機械也跟人類一樣？
2.3 代表美麗的函數
Column　機械也有老師

第3章｜挑戰最佳化問題
3.1 皇后全力衝刺！
Column　從演算法多學一點
3.2 模型的極限
Column　訓練資料與測試資料
3.3 建立新的特徵值
Column　如何建立困難的函數？
3.4 神經網路
Column　大腦的資訊處理機構

第4章｜挑戰深度學習
4.1 推桿推不動了？
Column　深度學習的風潮
4.2 注意過擬合
Column　機械學習就是與過擬合戰鬥
4.3 批次學習與在線學習
Column　隨機梯度下降法的復活

第5章｜預測未來
5.1 識別的鏡子
5.2 尋找分界線
Column　支持向量機的泛化能力
5.3 原本就能分離嗎？
Column　扭曲空間的核心函數
5.4 填補資料的缺漏
Column　資料的本質
5.5 掌握資料的本質
Column　稀疏性與人類的直覺

第6章｜映出美麗的鏡子
6.1 珍貴的圖片資料
Column　利用磁鐵進行機械學習？
6.2 玻爾茲曼機械學習的影像處理
Column　機械學習與統計力學
6.3 能辨識更複雜的特徵嗎？
Column　變分原理
6.4 使用隱藏變數，打造多元世界
Column　採樣專用機器登場
6.5 複雜資料的真面目
Column　辛頓先生的意志力

第7章｜只找出臉部的美麗度
7.1 知道世上所有事情的魔鏡
7.2 魔鏡啊魔鏡、魔鏡先生

序
看到孩子的成長後，總是不禁問自己：「他們到底是怎麼理解事物的呢？」雖然可一言以蔽之地以「就是從反覆的失敗與嘗試之中學習知識，再理解事物」的答案來回答這個問題，但是若能了解「那麼這些知識又是什麼知識？」，那麼說不定就能讓電腦獲得與人類相同的智能吧？實現這個夢想的技術就是近年來蔚為流行的機器學習。這是一種透過反覆嘗試與失敗，學習社會規則的技術。到底是何種方式學習這世上的事情呢？
機器學習正處於不斷演化的階段，而本書則打算介紹其中的玻爾茲曼機械學習與深度學習（Deep Learning）。所謂的玻爾茲曼機械學習是欣賞各種圖片，記憶世上風景的技術。即使是有點模糊或部分被遮住的圖片，人類也能立刻了解圖片的內容。這是因為人類能斟酌過去的經驗與現在的狀況，了解圖片的內容，現在已經能讓電腦搭載這種技術了。應用這種基本技術的就是玻爾茲曼機械學習，也就是在電腦打造睛與腦部記憶的構造。深度學習則是在這項技術加上腦部判斷能力，讓電腦根據周遭的情況做出這個是這樣，那個是之前看過的那個的判斷技術。大家是不是覺得，這個技術很厲害呢？
這些技術或許可實現超乎現在想像的「人工智慧」，而全世界也正籠罩著如此興奮的感覺。讓全世界驚豔的電腦技術之一，就是Deep Mind開發的Alpha Go吧。大家應該都知道這條透過最新的機器學習技術，讓電腦在圍棋的世界大勝人類的新聞吧。現在真的是很不得了的時代，但是這項技術的真面目到底是什麼？現在應該有很多人對此抱著興趣吧。
好吧，那就一起閱讀機器學習的書吧！抱著這個想法跑進書店，應該會看到不少的書。而且在這個時代，只要上網搜尋一下，大概就能得到不少知識。接觸這些資訊之後，一定會有不少人感到挫折，因為這些資訊充滿了一堆看起來很難的公式，這些公式到底是幹嘛用的？到底是怎麼讓電腦獲得智能的？對於只是想知道這些事情的人來說，要理解這些資訊的確難度很高。
因此本書將試著以「沒有公式」的「故事」從「機器學習為何」開始講解，也將介紹造成轟動的深度學習以及為深度學習的草創時期帶來進化曙光的玻爾茲曼機械學習。我希望把本書寫成誰都能輕鬆理解的內容，讓大家覺得這本書前所未有的簡單！
所以，本書適合對機器學習有興趣的上班族閱讀，也適合準備開始新興趣的人閱讀。即使是準備安排退休生活的高齡人士，應該也會覺得本書有趣才對。我試著把本書寫成適合與父母親一起進行自由研究的小學、國中題材，我也認為閱讀到故事的尾聲時，將可培育出開拓機器學習未來的人材。如果本書能成為敲開一億總機器學習時代的敲門，那將是筆者的榮幸。

內文試閱
機械的自主學習

機械學習可透過學習這個容易想像的字眼進一步了解。請想像成讓機械學習的樣子。這裡指的機械是電腦，所以在電腦裡輸入各種資料就等於讓電腦學習。
簡單來說，就是讓電腦看大量的計算練習題，不斷地連續計算，這世界上有這種問題，這麼做就是解開問題，這等於是叫電腦模仿人類的解題方式。
不過，聽到這裡，大家應該會有疑問吧？機械真的能了解這些計算方式嗎？其實它們並不了解。感覺上就只是讓電腦看大量的問題與解答的模式，然後再從中找出法則或規則，最後順利得出解答而已。人類的學習也差不多是這種模式。如果被別人問到「為什麼加法會是這樣的加法？」大部分的人應該只能回答加法就是加法。
我們常常都是憑藉著經驗與結果接受既定的事物，然後再繼續向前進。而機械學習就是讓機械以這種模式學習。
如果對象是人類，當然就能更有效率地教導規則，而教導規則的過程就稱為教育，但是當對象換成機械，又該怎麼教才有效率呢？由於我們是人類，所以有必要找出能更有效率地教導機械的方法，而這個方法就是數學的公式，這或許也是大部分機械學習初學者覺得困擾的部分。

機械的自主學習
加法、減法、乘法、除法，這是誰都學過的四則運算。
不過大家真的敢說完全理解這些運算嗎？或許大家能完成運算，但真的能說已經了解這些運算嗎？即使能正確運算，但其實不了解這些運算的真正意義，只是學會了這些運算的規則而已。
機械學習所做的事就是了解輸入與輸出之間的關係，換言之就是判讀輸出入的關聯性。
這世上已經有這樣的規則，所以教電腦依樣畫胡蘆地模仿這些規則，然後試著根據這些規則輸入資料，結果就得到同樣的輸出結果。如果稍微調整規則，輸出的結果也會跟著改變。重複這個過程，就能得到不同的輸出結果。這跟小孩鬧著玩，結果玩出很多花樣是一樣的道理。
此時的父母親會跟小孩說：「這樣做才對喲」。做計算練習題的時候也是一樣。只要稍微算錯，就會被打叉，老師也會幫忙修正。總之就是一邊訂正，一邊複習，再進行微調。
機械學習做的事情跟這些完全一樣。目標是要解出所有問題的正確答案，所以不斷不斷地解同一個問題。為了讓輸出的結果與資料相符，不斷地調整參數。為了提高解題率，所以重複細部的調整。大家都持續相同的努力。
這種微調稱為最佳化問題。為了讓解題率與得分最大化以及算出所有題目的解答，所以不斷微調參數。發現機械學習其實跟大家一樣這點，是不是讓大家比較放心了呢？

機械也有老師
讓我們回到計算練習題的例子吧。大部分的計算練習題除了有題目，後面也會附上解答。
除了題目之外，連解答也一併附上，然後看看有這些資料時，會產生什麼結果的這種邊教邊學習的過程，就稱為監督式學習。
另一方面，只揭露題目，不附上答案也是很棒的學習，因為可掌握這類問題的特徵。有這些資料，卻不說會發生什麼事，讓學生逕自觀察會有什麼結果的過程稱為非監督式學習。
其他還有很多像這種對比的例子。這個音樂是由誰做曲，這個音符的音階、節奏，是有這種名稱的特例，這種附上補充資訊，讓學生學習的情況就是監督式學習。讓學生持續聽音樂，然後找出其中的節奏或是音階，學習出現了哪些音符，就是所謂的非監督式學習。
監督式學習可讓該音樂具有哪種性質具體浮現，相對的，非監督式學習則是學習音樂這個概念。
小孩子一開始應該就是以非監督式學習的方式學習。觀察身邊的景色、世界的風景、聽到的聲音、味道，然後學習這一切的氛圍。雖然有些東西不太了解，但是學習這些不了解的東西是什麼，然後整理成記憶。
隨著慢慢地成長，就開始了解大人所說的話，或是開始讀書，理解這些東西是什麼東西，進行所謂的監督式學習。小孩子常常會瞬間長大，而其中似乎有所謂的學習祕訣。機械還是人類，其實都有所謂的學習祕訣。

深度學習的風潮
以多層神經網路為本，利用複雜的神經網路進行機械學習是早就有的想法，而且歷史也非常悠久，到了現代總算發展成勢不可擋的規模。到底是什麼東西爆發這股熱潮的呢？答案就是現在的資料越來越龐雜，也越來越容易取得。
多層神經網路之中有無數的參數以及代表特徵值重要度的權重。為了要符合如此大規模資料的不同面向，就必須相對的預備如此多的參數。而在最佳化這些參數時，必須擁有透過各種條件實驗所得的版本資料。簡單來說，多層神經網路的學習需要取得大量的資料。
早期很難得到如此大量的資料，所以也很難實施多層神經網路的學習，這點想必大家已經察覺到了吧。而且就算能取得資料，要學習擁有如此大量參數的神經網路也非常困難，所以皇后與僕人才會忙得團團轉。
在演算法方面，神經網路的性質方面，以及激活函數的開發，都有各式各樣的小型研究進行，但是在早期的時候，就算擁有如此優異的演算法，當時的電腦也無法處理如此大規模與大量的資料。不過，到了連筆記型電腦都能高速運算的現代，這些困難的運算也變得簡單了。
深度學習就是利用複雜的多層神經網路進行的機械學習，現在之所以會變得如此熱門，全是因為能輕鬆取得大規模的資料，而且電腦的性能也已提升至能處理這些大量資料的地步，同時演算法也有了長足的發展。換言之，這股總算到來的熱潮讓深度學習變得不再是遙不可及的夢想。

作者簡介

大関真之
現任教於日本東北大學。專長是統計力學、量子力學、機器學習。曾經榮獲得手島精一紀念研究賞博士論文賞、第6回日本物理學會若手獎勵賞、文部科學大臣表彰若手科學者賞。

行銷計劃