星期日, 3月 31, 2024

如何寫好一篇論文(09) - 文獻分析的三種邏輯推理方法

連結

- 有說服力的邏輯推理方法大體有三種:歸納、演繹、溯因
- 可對文獻資料進行分析來推出自己的論點,例如衝突、解決方案等
- 也可以用於論文的討論和結論

- 歸納 inductive reasoning
    * 由點到線,發現新的規律
    * 對各種不同的資料進行歸納總結
    * 由個別的證據推斷出一般性的規律
    * 人類幾乎所有的知識都來源於歸納
    * 常見的方式有求同和求異兩種
        # 求同:找出各種不同文獻資料之間的共同點,推斷出較為普遍性的規律
        # 求異:比較各種不同文獻資料之間的不同點,找到造成這種不同的關鍵因數或者是變量

- 演繹 deductive reasoning
    * 由一般到個別,建立新的證據
    * 文獻中已經總結出某種一般性的規律
    * 結合我們當前實際情況
    * 大前提 -> 小前提 -> 結論之三段論屬於演繹推理

- 溯因推理 abductive reasoning
    * 由點到虛線的推理方法,提出新的假說
    * 科學的前沿探索的過程中文獻中證據往往是雜亂而不完整
    * 由已知的所有線索排除各種可能性從而最終推斷出真相和最有可能的解釋
    * 從一堆看似雜亂無章的事實中獲得洞見
    * 比歸納和演繹更需要創造性思維,類似偵探破案
    * 要求研究者對於各種可能性有深刻的認識
    * 結果一般是新的假說,需要進一步的實驗論證

- 推理方法為退化的歸納、演繹法,並不嚴謹
- 語文教科書的舉例論證、引用論證、比喻論證、對比論證等傾向修辭學而非真正的邏輯推理方法

 

全文連結

星期二, 3月 26, 2024

Theory & Systems for Weak Supervision by Christopher Re @MLSYS 2020


Snorkel Github
Practical Weak Supervision: Doing More With Less Data

這陣子為了 computer vision 還有 weakly supervised learning 的事情頭痛。要發 paper 需要 label 動輒破千的影像資料讓我快燒壞腦袋。

這應該是這陣子聽到最重要的 talk。重點在於 Snorkel 這個 project。相較於 supervised learning 要專家直接標資料,Snorkel 將問題從 data labeling 轉變成如何找出夠多的 weak labeling function,然後在目前我還沒搞懂的 labeling model 或投票機制作用之下,weakly supervised model 或 gold + silver label 的方法訓練出來的成果不會比專家爆肝差太多,但專家爆肝可能要一年才有辦法幾千份,labeling function 快的話只要幾天。

只是目前看到的 tutorial 都還在用 NLP 說明,還不知道怎麼做 weakly supervised object segmentation or detection。不過有 Oreilly 有出書整理,應該會比直接啃論文快些。

全文連結

星期日, 3月 24, 2024

如何寫好一篇論文(08) - 用故事邏輯寫文獻綜述

連結

 

- 文獻綜述
    * 引導出我們自己的研究目標
    * 用文獻來支撐我們的自己的研究目標的重要性和合理性
    * 用講故事的邏輯來寫我們的文獻綜述,需要有起伏

- SCQA 模板
    * 情境、衝突、關鍵問題、解決方案
    * 可以包含多重起伏
        # 例如 Background and history -> 衝突1,解決方案1 -> 衝突2、解決方案2 -> ...-> 最終遺留問題
        # 最終遺留問題可作為 future direction
    * 可根據狀況調整順序
    * 關鍵問題和解決方案已可被讀者接受 -> 開門見山 QASC 或 QACS
        # 首先提出關鍵問題和解決方案直接點名本篇論文的研究目標
        # 隨後再慢慢的介紹情景和沖突
    * 追求衝擊力 -> CSQA
        # 首先提出沖突引發讀者的關注
        # 隨後再介紹前情和後續的解決方案

    * 情境(S)
        # 實現和讀者的對接,取得讀者的基本的信任
        # 挑出文獻中最不具爭議讀者最容易認同的部分來寫
    * 衝突(C)
        # 起伏的開始
        # 可能是一個顯然的挑戰
        # 也可能是通過文獻分析才能夠發現的一個潛在的威脅或者機遇
    * 關鍵問題(Q)
        # 作者需要明示出解決所提出沖突的關鍵點在哪裡
        # 往往最能體現出作者的眼光
    * 解決方案(A)
        # 一個有說服力的解決方案就能自然地帶出本篇論文的研究目標和它存在的意義

全文連結

星期三, 3月 20, 2024

好文:一文搞清楚LORA、Prompt Tuning、P-Tuning、Adapter 、Prefix等大模型微调方法

出處

知乎上看到的好文,總結了 LLM 微調的有效方法,包括 LORA、Prompt Tuning、P-Tuning、Adapter、Prefix Tuning。很多之前網路上或李弘毅老師的課看過,或大概聽過。但還是有些概念比較新,例如 Prompt Tuning、P-Tuning、Prefix Tuning。應該能當作淼 NLP paper 的靈感庫了。

全文連結

星期二, 3月 19, 2024

Weakly supervised semantic segmentation for CNN

 我司最近忽然提起可以試著用醫學影像發 paper。但我完全是外行,從數學到模型到寫程式都需要自學,還沒有人標資料,差點把我嚇出心臟病。

CV 和之前玩 NLP 不同。NLP (至少我自己那篇)可以用 regex 或其他方法先弄出不那麼精確的 label 再人工校正,不需要真的從無到有通通自己標,但 CNN 至少我目前還不會這些方法。所以只好趕快去問網路。

目前找到一門課還有一份 slide 可以看。

ECCV 2020 WSL tutorial: 1. Introduction to the tutorial on Weakly Supervised Learning



Weakly Supervised CNN Segmentation: Models and Optimization
來源

不管會不會看,松鼠黨先屯了再說 XD

全文連結

星期一, 3月 18, 2024

李弘毅老師【機器學習 2023】(生成式 AI)課程

連結


又自學完一門 ChatGPT 的課程。面向大學生,應用類的。

內容比教 BERT 的課程淺顯很多,畢竟是面向 API 的。不過也可以作為不錯的基礎用來跑 data 寫 paper 了。

最後幫李弘毅的課點讚,內容比吳恩達老師的課豐富許多 XD

全文連結

星期三, 3月 06, 2024

狼蛛 F99 鍵盤入手


第三把機械鍵盤入手,正式成為鍵盤富翁 XD

前兩把分別是 Ducky 2108s 和 Ducky ONE 2,都是青軸。以前覺得機械鍵盤就是只有分「青軸」跟「其他」,畢竟最接近小時候鍵盤的感覺。

但後來青軸打到精神疲勞。看到別人鍵盤和各種傳教影片就入坑這把狼蛛 F99,蝦皮 $1600 入手。中國鍵盤,堆料有誠意,但作工有些小瑕疵,開箱的時候有個鍵帽掉了下來,側面看也有些鍵帽安裝的高度不是很整齊,要按一下。鍵帽裝好後功能上沒什麼問題。
 
鍵盤內膽是 Gasket 結構,支援熱插拔,軸體是收割者軸(非 Cherry 軸),是線性軸,沒段落感,但打感卻意外脆爽,比紅軸好觸底很多,有點像茶軸但更乾脆些。重點是 HIFI 鍵盤聲,手速飆起來的話真的是麻將音 XD。

整體使用滿意,聲音和清脆省力的觸鍵很療癒。就 99 鍵布局還不習慣,暫時稍微影響打報告速度,有些功能鍵要找,鍵盤布局緊湊,常常要按 F4 卻按到 F5 去。另外中國鍵盤當然沒注音,目前注音全部靠盲打。等注音側刻貼紙到貨後再根據需要處理一下。原本的青軸就先暫時休息 XD

全文連結

師大李國瑋老師高等微積分講義

連結

最近為了研究高維度 R^n 上的微積分,開始學高等微積分。目前上清華大學高教授的線上課程。但哪怕仔細挑了老師,課程本身還是抽象到炸,根基不穩現在影片有點聽不懂了。決定複習一下,鞏固境界,再繼續上。

很遺憾高教授指定教材 Elementary Classical Analysis 對醬料生實在太難,看完 Introduction 集合理論的公理化還有數學史,就覺得腦袋開始生大病。

還好這時候發現李老師的講義,雖然頁數一樣都是 300 多頁,但是明顯比原文好啃不少。就先從這入手試試。

全文連結

星期一, 3月 04, 2024

Iwin 「兒童色情」事件目前小感

最近不斷看文章,iwin 「兒童色情」事件個人感覺逐步明朗。

這件事根本不是「反兒童色情 v.s 肥宅」之爭,而是「基督價值 v.s 台灣多數價值」之爭。看推動者宗教背景深厚就知道了。

天主教、基督教天然敵視「性」,認為「性」本身是獸行,只有在「主」准許的婚姻之中,「性」將男女雙方以愛結合並產生後代,這時候的「性」才是好的。天主教、基督教強調兒童和青年應該是純潔的,和污穢的「性」不可以連結在一起,哪怕是虛構的兒童和青年也不行。

從這角度看就可以解釋保守團體的過度反應。明明 ACG 造成兒少性剝削極低,我國根本沒有。交友軟體、甚至陌生人手中的糖果餅乾對兒少都比 ACG 危險的多,也有真實受害案例,但保守派卻只管虛擬人物有沒有露點(連靜香洗澡都算),對真正傷害兒少的兇手視而不見。這些保守團體背後還都有一神教背景。

原來目的是傳教,不是為了保護兒童。和同婚一樣,宗教團體反同婚,說同婚不能生小孩、可以同婚那也可以跟摩天輪作愛...都假的,他們反對的真實理由是這樣違背神和教會的教誨。但是他們知道神和教會不是能上檯面的理由,所以就弄各種表面上的藉口。這些藉口都假的,駁倒他們就換其他藉口。保守宗教團體只想大眾聽他們的,從來沒有想溝通,畢竟只有凡人向神認錯,哪有神對凡人退讓的道理?神旨到凡人下跪接著就對了!多少年過去了,他們還認為「別人」用保險套是有罪的,這種人是能溝通什麼?              

保守團體目前的作法,就是「販賣恐懼」,先說不怎樣怎樣做,真實小孩就會被害喔,然後再舉一些確實有問題的作品,例如重口味的漫畫(但這些重口本用現行妨害風化罪就可以法辦,根本不用曲解兒少法),引起民眾恐懼後就偷渡一竿子打翻一船人的提案,以實現天主教基督教國家兒童純潔化的宗教願景,連大雄偷看靜香洗澡都違法,名正言順的用思想罪打擊異教徒。

某些政治人物也不清醒,可能有人覺得之前得罪教會,導致選舉失利,乾脆擁抱極右派,但極右是遠離中間的死路。除非台灣伊朗化,倒退成一神教的地上神國,否則宗教保守派永遠不會滿足。

看美國共和黨墮胎權爭議就知道,宗教保守派的主張一直步步進逼,一開始說推翻全國墮胎權(Roe v. Wade)是為了尊重州權。推翻後發現各州公投一直輸,就推動調高公投門檻,不讓州民保護墮胎權。連這樣都失敗,就改口該由聯邦設定墮胎限制(這時候又不尊重州權了),一直亂下場就是共和黨被極右拖累,選舉一直失利。極右還要批評共和黨對生命的捍衛不夠。


我尊重他人信仰一神教的權利,但用強制的方式逼所有人接受一神教價值就是侵害他人。套釋 617 的話。ACG 就算要管理,也要基於「多數人普遍認同之性觀念或性道德感情」且「對少數性文化族群.....予以保障。」來管。色情的「性秩序」紅線應由多數人認定,不是一神教替全國所有人認定。                                

全文連結