WEFV2626EFCEYYYB15VEF |
內容簡介
台語文三代人的家族史
台灣母語振興者Lah-jih
上親切活跳ê庄跤囡仔家族史
台語文運動者蕭平治堅心傳承母語、用台語創作。對國校老師退休了後,家己學台語文拼音,佇90年代電腦網路起行的時陣,開發電腦拍字軟體,編寫教材、起網站blog,為著台語文運動拍拼奉獻二十外冬,持續推sak台灣主體性ê台灣學(Taiwanology)。
這本《Lah-jih身世kap親人》,是伊家族kap身世ê紀錄,透過上純粹、上媠氣ê台語書寫,寫出家己ê家族歷史,見證台灣佇清國、日本時代到今仔日ê中華民國三段殖民統治之下,台灣人民ê生活點滴,會使講是台灣殖民史ê縮影。
蕭平治(Lah-jih)佇本冊寫出祖厝歷史變遷、爸母慈愛ê事蹟、兄弟ê溫暖親情,mä有Lah-jih伊tī學校讀冊ê趣味代誌。內面有真濟話語是漸漸拍無去、已經失傳ê台灣話,這lóng是人類文化學kap 民俗學會當去研究ê好材料。這本冊定著是台語語言學真寶貴ê語料,同時也是台灣家族歷史書寫、歷史研究ê珍寶。
作者介紹
蕭平治(Siau Lah-jih)
生日:1941年8月8日(農曆閏6月16日)
E-mail:lahjih@gmail.com
學歷:
彰化縣田中第一國民學校
省立彰化中學初中部
省立台中師範學校普師科:1962
省立台中師範專科學校師資科
經歷:
1962.8~1977.7彰化縣三潭國小教師
1977.8~2005.7彰化縣田中國小教師
2000.7~2005.8彰化縣本土語言種子教師
2002.7~2005.8彰化縣國教輔導團台語輔導員
2002.7~2005.8彰化縣本土語言師資培育講師
2002.9.28服務40年獲教育部資深優良教師獎
2002.9.28彰化縣91年特殊優良教師 (師鐸獎)
2002.11~2005.8彰化縣國小台語教材教學諮詢委員
2002.12.26~2003.12.25教育部國語推行委員會委員
2003.12~2004.1教育部「調查國民中小學閩南語教科書或教材用字計畫」工作小組委員
1962.8~2005.8彰化縣田中國民小學退休
2005.9~2019彰化縣國教輔導團 台語輔導顧問
2008~2012彰化縣本土語言推動委員會委員
1996.1.1~2019財團法人半線文教基金會董事
2001.9.9~2007.8台灣羅馬字協會第一、二、三屆理事
2006.2.1~2010.7.31中山醫學大學專業技術講師
台語文教學經歷:
1991年5月,佇一个鄉土文化研習營,接觸台語音韻十五音ê教學,tō投入台語音韻ê研究。並chiâⁿ做彰化縣母語教學種籽教師。
1993年歇熱,接觸鄭良偉教授「羅漢lām寫」台文觀念,寫出第一篇台文作品「阿爸ê鹿角煙吹」tō受著肯定,開始台文寫作ê興趣。
1995年7月,為著台文寫作,開始學電腦,應用台文輸入法寫作,愈寫愈趣味愈寫愈進步。
1998年6月《台灣俗語鹹酸甜二百五十串》獲教育部『獎勵漢語方言研究著作』佳作獎狀及獎金五萬元。
目錄
02 志榮公厝地_崁頂廷光公-輝騰公-志榮公厝宅記憶
03 志榮公_祭文
04 阿媽_阿媽
05 阿爸_挨弦仔/ 阿爸ê鹿角薰吹
06 阿爸_阿爸做忌
07 阿母_Ī--ä ê DNA
08 阿母_今仔日ī--ä做忌
09 大兄_大兄 Lah-jih
10 大兄_阿里山縣長 ─ 懷念大兄
11 大嫂_平凡偉大的母親
12 大嫂_感謝大嫂
13 大嫂_蒜仔炒煙腸
14 二兄_唱歌ê啟蒙老師(懷念二兄)
15 二嫂_二嫂 感謝你
16 二嫂_門縫ê祕密
17 三兄_三兄
18 三兄_剉甘蔗
19 四兄_四兄ê畢業證書
20 四兄_四兄 ê修了證書kap思ひ出
21 四兄_Harmonica kap Violin
22 蕭平治_一年仔生放屎糊房間
23 蕭平治_人生第一張しゃしん(寫真)
24 蕭平治_64年前ê舊相片
25 蕭平治_狀元
26 蕭平治_惡補10個月kap鄭來生老師
27 蕭平治_放牛食草牛仔班
28 蕭平治_塗豆1甌5角----chah飯包ê日子
29 蕭平治_咱人6月16
30 蕭平治_1961年國民小學教員
31 蕭平治_大霸尖山叫魂記
32 蕭平治_音樂、音響、sim-sek、s¡g/ 思母
33 蕭平治_八月15暝
34 蕭平治_70足歲生日感言
35 蕭陳敬 十二生相歌
詳細資料
- ISBN:9789578018877
- 叢書系列:
- 規格:平裝 / 224頁 / 15 x 21 x 1.12 cm / 普通級 / 單色印刷 / 初版
- 出版地:台灣
- 本書分類:> >
讓我們看看可以用在你自己的 NLP 應用中的十幾個工具吧。 ... 在過去的幾年裡,自然語言處理(NLP)推動了聊天機器人、語音助手、文本預測等這些滲透到我們的日常生活中的語音或文本應用程技術的發展。目前有著各種各樣開源的 NLP 工具,所以我決定調查一下當前開源的 NLP 工具來幫助你制定開發下一個基於語音或文本的應用程式的計劃。 儘管我並不熟悉所有工具,但我將從我所熟悉的程式語言出發來介紹這些工具(對於我不熟悉的語言,我無法找到大量的工具)。也就是說,出於各種原因,我排除了三種我熟悉的語言之外的工具。 R 語言可能是沒有被包含在內的最重要的語言,因為我發現的大多數庫都有一年多沒有更新了。這並不一定意味著它們沒有得到很好的維護,但我認為它們應該得到更多的更新,以便和同一領域的其他工具競爭。我還選擇了最有可能用在生產場景中的語言和工具(而不是在學術界和研究中使用),而我主要是使用 R 作為研究和發現工具。 我也驚訝地發現 Scala 的很多庫都沒有更新了。我上次使用 Scala 已經過去了兩年了,當時它非常流行。但是大多數庫從那個時候就再沒有更新過,或者只有少數一些有更新。 最後,我排除了 C++。 這主要是因為我上次使用 C++ 編寫程序已經有很多年了,而我所工作的組織還沒有將 C++ 用於 NLP 或任何數據科學方面的工作。 Python 工具 自然語言工具包(NLTK) 毋庸置疑,自然語言工具包(NLTK)是我調研過的所有工具中功能最完善的一個。它幾乎實現了自然語言處理中多數功能組件,比如分類、令牌化、詞幹化、標註、分詞和語義推理。每一個都有多種不同的實現方式,所以你可以選擇具體的算法和方式。同時,它也支持不同的語言。然而,它以字符串的形式表示所有的數據,對於一些簡單的數據結構來說可能很方便,但是如果要使用一些高級的功能來說就可能有點困難。它的使用文檔有點複雜,但也有很多其他人編寫的使用文檔,比如這本很棒的書。和其他的工具比起來,這個工具庫的運行速度有點慢。但總的來說,這個工具包非常不錯,可以用於需要具體算法組合的實驗、探索和實際應用當中。 SpaCy SpaCy 可能是 NLTK 的主要競爭者。在大多數情況下都比 NLTK 的速度更快,但是 SpaCy 的每個自然語言處理的功能組件只有一個實現。SpaCy 把所有的東西都表示為一個對象而不是字符串,從而簡化了應用構建接口。這也方便它與多種框架和數據科學工具的集成,使得你更容易理解你的文本數據。然而,SpaCy 不像 NLTK 那樣支持多種語言。它確實接口簡單,具有簡化的選項集和完備的文檔,以及用於語言處理和分析各種組件的多種神經網絡模型。總的來說,對於需要在生產中表現出色且不需要特定算法的新應用程式,這是一個很不錯的工具。 TextBlob TextBlob 是 NLTK 的一個擴展庫。你可以通過 TextBlob 用一種更簡單的方式來使用 NLTK 的功能,TextBlob 也包括了 Pattern 庫中的功能。如果你剛剛開始學習,這將會是一個不錯的工具,可以用於對性能要求不太高的生產環境的應用。總體來說,TextBlob 適用於任何場景,但是對小型項目尤佳。 Textacy 這個工具是我用過的名字最好聽的。先重讀「ex」再帶出「cy」,多讀「Textacy」幾次試試。它不僅僅是名字讀起來好,同時它本身也是一個很不錯的工具。它使用 SpaCy 作為它自然語言處理核心功能,但它在處理過程的前後做了很多工作。如果你想要使用 SpaCy,那麼最好使用 Textacy,從而不用去編寫額外的附加代碼就可以處理不同種類的數據。 PyTorch-NLP PyTorch-NLP 才出現短短的一年,但它已經有一個龐大的社區了。它適用於快速原型開發。當出現了最新的研究,或大公司或者研究人員推出了完成新奇的處理任務的其他工具時,比如圖像轉換,它就會被更新。總體來說,PyTorch 的目標用戶是研究人員,但它也能用於原型開發,或使用最先進算法的初始生產載荷中。基於此基礎上的創建的庫也是值得研究的。 Node.js 工具 Retext Retext 是 Unified 集合的一部分。Unified 是一個接口,能夠集成不同的工具和插件以便它們能夠高效的工作。Retext 是 Unified 工具中使用的三種語法之一,另外的兩個分別是用於 Markdown 的 Remark 和用於 HTML 的 Rehype。這是一個非常有趣的想法,我很高興看到這個社區的發展。Retext 沒有涉及很多的底層技術,更多的是使用插件去完成你在 NLP 任務中想要做的事情。拼寫檢查、字形修復、情緒檢測和增強可讀性都可以用簡單的插件來完成。總體來說,如果你不想了解底層處理技術又想完成你的任務的話,這個工具和社區是一個不錯的選擇。 Compromise Compromise 顯然不是最複雜的工具,如果你正在找擁有最先進的算法和最完備的系統的話,它可能不適合你。然而,如果你想要一個性能好、功能廣泛、還能在客戶端運行的工具的話,Compromise 值得一試。總體來說,它的名字(「折中」)是準確的,因為作者更關注更具體功能的小軟體包,而在功能性和準確性上有所折中,這些小軟體包得益於用戶對使用環境的理解。 Natural Natural 包含了常規自然語言處理庫所具有的大多數功能。它主要是處理英文文本,但也包括一些其它語言,它的社區也歡迎支持其它的語言。它能夠進行令牌化、詞幹化、分類、語音處理、詞頻-逆文檔頻率計算(TF-IDF)、WordNet、字符相似度計算和一些變換。它和 NLTK 有的一比,因為它想要把所有東西都包含在一個包裡頭,但它更易於使用,而且不一定專注於研究。總的來說,這是一個非常完整的庫,目前仍在活躍開發中,但可能需要對底層實現有更多的了解才能完全發揮效力。 Nlp.js Nlp.js 建立在其他幾個 NLP 庫之上,包括 Franc 和 Brain.js。它為許多 NLP 組件提供了一個很好的接口,比如分類、情感分析、詞幹化、命名實體識別和自然語言生成。它也支持一些其它語言,在你處理英語之外的語言時能提供一些幫助。總之,它是一個不錯的通用工具,並且提供了調用其他工具的簡化接口。在你需要更強大或更靈活的工具之前,這個工具可能會在你的應用程式中用上很長一段時間。 Java 工具 OpenNLP OpenNLP 是由 Apache 基金會管理的,所以它可以很方便地集成到其他 Apache 項目中,比如 Apache Flink、Apache NiFi 和 Apache Spark。這是一個通用的 NLP 工具,包含了所有 NLP 組件中的通用功能,可以通過命令行或者以包的形式導入到應用中來使用它。它也支持很多種語言。OpenNLP 是一個很高效的工具,包含了很多特性,如果你用 Java 開發生產環境產品的話,它是個很好的選擇。 Stanford CoreNLP Stanford CoreNLP 是一個工具集,提供了統計 NLP、深度學習 NLP 和基於規則的 NLP 功能。這個工具也有許多其他程式語言的版本,所以可以脫離 Java 來使用。它是由高水平的研究機構創建的一個高效的工具,但在生產環境中可能不是最好的。此工具採用雙許可證,具有可以用於商業目的的特定許可證。總之,在研究和實驗中它是一個很棒的工具,但在生產系統中可能會帶來一些額外的成本。比起 Java 版本來說,讀者可能對它的 Python 版本更感興趣。同樣,在 Coursera 上最好的機器學習課程之一是斯坦福教授提供的,點此訪問其他不錯的資源。 CogCompNLP CogCompNLP 由伊利諾斯大學開發的一個工具,它也有一個相似功能的 Python 版本。它可以用於處理文本,包括本地處理和遠程處理,能夠極大地緩解你本地設備的壓力。它提供了很多處理功能,比如令牌化、詞性標註、斷句、命名實體標註、詞型還原、依存分析和語義角色標註。它是一個很好的研究工具,你可以自己探索它的不同功能。我不確定它是否適合生產環境,但如果你使用 Java 的話,它值得一試。 你最喜歡的開源 NLP 工具和庫是什麼?請在評論區分享文中沒有提到的工具。 via: opensource.com/article/19/3/natural-language-processing-tools 作者:Dan Barker 選題:lujun9972 譯者:zxp 校對:wxy 本文由 LCTT 原創編譯,Linux中國 榮譽推出
WEFV2626EFCEYYYB15VEF |
文章來源取自於:
壹讀 https://read01.com/NNGjLQg.html
博客來 https://www.books.com.tw/exep/assp.php/888words/products/0010846113
如有侵權,請來信告知,我們會立刻下架。
DMCA:dmca(at)kubonews.com
聯絡我們:contact(at)kubonews.com
綠園道附近法式劉海推薦髮廊綠園道附近兩側漸層髮型推薦染髮店外埔英倫風格的質感男仕理髮推薦髮廊烏日髮色去色處理
太平洋SOGO附近油頭的露額側分髮型上班族染髮推薦髮廊 台中南區漸層漂染推薦髮型設計工作室 台中專業剪髮新光三越附近瀏海減齡方式學生染髮推薦髮廊 大里好看不挑膚色推薦髮型設計工作室 布丁頭的救星推薦美髮沙龍綠園道附近短龐克髮型推薦染髮髮廊 沙鹿逗號瀏海 燙髮技術最好的台中髮廊大雅油頭造型推薦髮廊推薦染髮髮廊 烏日解決布丁頭髮廊推薦染髮髮廊 PTT推薦的台中護髮染髮燙髮推薦