教科書:

1. Jimmy Lin and Chris Dyer, Data-Intensive Text Processing with MapReduce, forthcoming, 2010.
2. Tom White, Hadoop: The Definitive Guide, O'Reilly, 2009.

簡介:
本課程介紹雲端運算、資料密集(可處理一兆筆以上資料)之程式設計新方法。
針對最容易使用的 MapReduce 來授課與實作。MapReduce 是一種新的程式設計架構,
可以很抽象地表達大量資料在一組伺服器上分散平行運算,解取常見的問題,
如計算頻率、製作搜尋引擎、網頁排名等。 Google 最早使用這種方式,開發
其搜尋引擎。而目前有自由軟體 Hadoop 可以支援 MapReduce 的運作。
除了 Hadoop 我們也將使用美國馬里蘭大學為 Hadoop 開發的 Cloud-9 工具。


(1) 課程中、英文名稱 (建議科號 ISA 557300)
雲端軟體服務實作(Cloud Computing Lab)


(2) 學分、修課人數、修課條件、上課時間
3 學分
修課人數 20 人
修課條件 先修過 自然語言處理實作
上課時間 Friday 1-4 PM

(3) 課程大綱

9/24 2. Introduction
10/1 3. Skipped bigram
10/8 4. Collocations from n-grams
10/15 5. Lexical/syntactic bundles
10/22 6. (Hadoop) skipped n-grams (with BNC filtering)
10/29 Midterm
11/5 7. (Hadoop) collocations from n-grams
11/12 8. (Hadoop) lexical/syntactic bundles
11/19 9. Word sense disamb. based on Yarowsky (1992)
11/26 10. Automated Grammatical Error Detection for 
 Language Learners (Leacock, et al.
2010)
 (term project 的 default 題)
12/3 11. Collocation Checker based Yarowsky (1992)
12/10 12. Exercise based on Wikipedia Dump
12/17 13. Exercise based on Wikipedia Dump
12/24 14. Exercise based on Wikipedia Dump

1/7 Final Exam
(4) 是否英文授課