星期三, 11月 06, 2024

GPT 研究吐苦水

連結

看到討論 GPT 的文章,想到自己快炸的研究。

最近被 GPT4 坑,比較放射科報告內文和醫囑做 anomaly detection,將報告分成正常、異常兩類。本以為是 low hanging fruit,只要調 prompt、call GPT4,就能有不錯成績還兼顧可解釋性,就能迅速生產研(ㄒㄩㄝˊ)究(ㄕㄨˋ)瑰(ㄌㄜˋ)寶(ㄙㄜˋ)整理投稿,達成工程職業績,可喜可樂~因為看好這個議題,個人還標了 3 * 10000 個 label 確保未來能夠投稿。

豈料 GPT4 表現極慘,正負平衡的樣本 F1 只能做到 0.7x,如果是正負比 1000:1 的 real world data 成績就更慘不忍睹。幾個月的努力要打水漂,並且支票要跳票,只好絞盡腦汁想辦法改實驗,用 BERT 做 sentence contradiction、更古老的 TF/IDF + ML、非監督式方法、各種策略都試過。

結果,最後最好的方法竟然是 rule-based parser,用工人智慧建立大表格做 dictionary lookup,只要 lookup table 夠大塞好塞滿就什麼都能判斷。算法和 lookup table 一路修改下 F1 score 從 0.1X 拉到 >0.85,正負平衡樣本還能作到 F1 = 0.99 還抓到不少 mislabeled data。結論:傳統 rule-based parser > fine-tuned BERT > GPT4。

問題好像解了(至少研究上),但這種結論怎麼解釋又是頭痛的問題,希望能順利投出 orz

全文連結

星期六, 11月 02, 2024

再戰「牛角」燒肉

之前為了「牛角」燒肉吃到飽一直漲價,為了吃牛舌改去「燒肉眾」,沒想到牛角菜單大改,CP 爆增。

之前要吃牛舌吃到飽,必須點最貴的「極上」方案,該方案平日也要 1399+10%。這個價位還沒有和牛,導致 CP 值極差,去牛角吃牛舌根本盤子。但新版菜單除了新增品項,也把很多原本在「極上」方案的品項下移到不到 1000 的「牛角」方案,包含非常愛吃的牛舌和牛角板腱,實質上就是降價。

更感動的是,牛角終於取消了甜點只能吃一份的限制。2024 年隨便一家便宜吃到飽都提供冰淇淋吃到飽,牛角最高可到 1399+10% 消費的吃到飽餐廳甜點還限量就顯得非常窮酸。菜單改後,第一次在牛角吃五球冰淇淋,實在非常感動 XD

這次牛角菜單改版,實質等同大幅度降價以及改善服務,未來應該是可以再去了。


全文連結

星期四, 10月 31, 2024

再見了 T460

這週下定決心,把陪伴多年的 Lenovo T460 送給北部的妹妹。上次出門旅行,發現 14 吋螢幕寫 code 開始會眼睛吃力,換華碩天選 5 pro。觀察到現在,確定 T460 可以安心退場,就決定送出。
 

這台 T460 是 2016 年上市的機器,當初應該是為了讀碩班換的,已經陪我七八年。當初還自費換 IPS 螢幕、升 16G 記憶體、後來又換 1T SSD,還有零零總總的防撞殼、鍵盤膜、螢幕保護貼,都是愛機一路征戰的回憶 QQ。送出前幫忙重灌、檢視 Macrium 映像檔,映像檔最後更新日期還停在 2023 年。還原 Win10 後一時還進不了桌面,原來是強制登入微軟帳戶但這個過程又當掉,後來透過 Safe Mode 和一些 trick 繞過。做了些測試,清潔了資料,設定了下妹妹最愛的桌面(?),然後就裝箱再見了。


其實我還有台更老的 IBM X200 現在還能開機 XD 但現在送那台就是折騰人了,還是送 T460 好了 XD



 
全文連結

星期六, 10月 19, 2024

「燒肉眾」食記

因為我喜歡日式調味而且喜歡牛舌,所以在台南吃吃到飽燒肉都去「牛角」。但「牛角」漲價越來越誇張,有牛舌的套餐已經漲到平日 1399 還有服務費,毫無吸引力,所以在留意有沒有更好的店。

台北「村上牧場」不錯,有 A4 和牛吃到飽,台南就不知道日式吃到飽燒肉可以去哪裡。「逐鹿」不貴、評價優、但口味沒有對到電波,「燒肉工廠」沒去過,單點燒肉如「碳佐麻里」、「乾杯」又覺得吃不過癮,偶然路過這家「燒肉眾」發現吃到飽有牛舌和 A5 和牛就留上了心。

第一次來,並沒有直奔最高級套餐,先吃 988 含美國和牛的價位,如果好吃未來再升級。

整體感覺不錯,肉類肉質口感 OK、不會太油膩。牛舌不是常見圓形大片,是長條片,Q 彈好吃。美和牛香氣口感尚可。非肉類的飯、麵、湯部份相對「牛角」種類少很多,這點較差。飲料部份現搾蔬果汁好評、無限冰淇淋大好評。結論來說,未來想再吃燒肉,會考慮來加價升級試試 A5 和牛。

 

吃完飯就到處晃,政大書局就在附近,進去看了但沒買書。也順路去看永福國小和台南一中兩個母校。永福國小感覺更小了,印象中小時候有的鞦韆和溜滑梯被拆了,多出了停車場 orz。台南一中感覺沒什麼變化,學校和大榕樹依舊,但當年一起的 TwsamDNADreamLinuxerFD 等人都各奔東西去了,之後就拐彎去緬懷育樂街,看看油膩不健康美食們還在不在,最後才打道回府。

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
全文連結

星期四, 10月 10, 2024

某 S 網站替代品

連結

某站已經長久不更新資源目錄,上面的東西都是舊的,很多比較新的資源都找不到。替代品資料也不完整,從來沒找到需要的東西。翻了知乎和常去社區都沒看到穩定的替代品。後來突發奇想在 Youtube 上下關鍵字,發現有網站在低調打廣告。實際花小錢辦最高級會員試用一個月,發現資源非常齊全,該有的都有。

目前感覺使用不方便,必須 PC 安裝程式,還必須非 Unicode 設定為簡體中文,非 Win11 電腦還要手動安裝 WebView2 才有辦法執行,付費限定支付寶、微信等強國方式。不過使用不方便也許不是缺點,這種資源還是小眾點好。



全文連結

星期二, 10月 01, 2024

如何寫好一篇論文(10) - 如何從文獻推出自己的論點

連結


- 從文獻出發,推出自己的觀點
- 寫作終極目的:為讀者創造價值,不是為了證明自己。要以服務讀者為中心
    * 推出自己論點前,把各方面情況掰開揉碎給讀者,幫讀者自己判斷,自己的意見當成參考意見,在讀者獲得充分信息之後再呈給讀者,反而有好影響力
- 五段落寫作模板
    * 第一段:分析、分解問題。幫讀者問題分析和考量我們面臨問題的各種不同方面,各種不同角度
    * 第二、三段:對不同方面、不同角度組織文獻資料分別進行討論。
        # 例如第二段講正方,第三段講反方,並在兩者間達成平衡
    * 第四段投入核心論點、關鍵砝碼,打破平衡,實現影響力
    * 第四段要補充、提昇讀者現有認知或文獻討論體現的認知
        # 例如一直以來認為重要的,你認為是次要的
        # 大家認為是複雜的問題,但你看出簡單的邏輯
        # 不同角度切入問題,發現新的威脅、機遇、衝突
        # 現有衝突中發現新的關鍵問題、解決方案
    * 第五段:對第四段提出的論點進一步發揮
- 先建立平衡,再打破平衡的模式,類似古代謀士,先提出上中下三策分析利弊為君主提出充分信息,顯示自己考慮問題細緻和客觀公正。最後只要關鍵處輕輕一點、就能打破平衡、影響決策。

全文連結

星期六, 9月 21, 2024

國家能處死罪犯嗎?人民才是最終裁判

憲法法庭作出 113 年憲判字第八號判決,對判死設下嚴格限制,也有大法官提出不同意見書。廢死論調是否禁得起檢視?

若國家無權殺國民,那麼萬一台海戰爭,向中國輸送情報或加入共軍是否也不得處死?若叛國殺人可處死,為何毒品殺人、性侵殺人不能處死?若生命價值沒有例外,則敵國犯台是否只能立刻投降保全國民生命?若民主、主權可以高於生命,為何其他價值不能?

若說死刑錯判不可恢復,自由刑也同樣不可恢復。美國有黑人被白人誣指為性侵犯,遭受 25 年冤獄,平反後仍無法挽回失去人生。即使真正的性侵犯被關,受害人也不會因犯人入獄而傷害消失,是否也該反對自由刑?

有說死刑沒用,但有極惡殺人犯曾文欽殺人後嗆「殺一、兩個人不會判死刑」,後來上法院則改口「是為了被判死刑才殺小孩」。若死刑沒用,為何殺人犯先自信不會判死而放手殺人,後來又在法庭上千方百計逃死?「案重初供」,相信殺人後的嗆聲是真實心聲。

廢死者說惡人出現是社會生病了,應該治病而非處死「治標」。但醫生治病都是標本兼治,不會為了讓病人重視預防,不去醫治不良生活習慣引起的病症。修復社會和處罰重犯為何非得二選一?

廢死主張是變形「宿命論」,犯罪是環境的錯,死刑犯不必負全責。若「宿命論」正確,史懷哲、南丁格爾做善事也沒有了不起。那是社會教的好,誰投胎過去都會一樣。

國家社會是群體,群體有權決定成員。一人若犯極惡罪行,被剔除身份和保障是理所當然。死刑告訴社會,人必須為行為負責,「正義的天平上只有生命能平衡
生命」(康德)。罪責不相當就是法律不公,「精英」無權制定不公法律強迫人民接受。若「精英」是真理化身,人民無權反對,則無論名字叫做皇帝、總書記還是大法官,本質都是專制統治者。
 
--
 
投書媒體了,希望能上 XD
全文連結