星期四, 4月 18, 2024

MedAI Session 20: Many Faces of Weak Supervision in Medical Representation Learning 觀後感

今天用用冗餘時間把 MedAI Session 20: Many Faces of Weak Supervision in Medical Representation Learning 看完一遍。感覺還是卡在同樣的地方,特別是如何用 noisy labeler 產生 probabilistic label 的部分,看來還是要繼續問 GPT 還有補數學。 

看的過程中,發現要看的 paper 也更多了。  

Data Programming: Creating Large Training Sets, Quickly 

 這篇也是講 Snorkel 的,但看來比之前看到那篇好懂一些。再努力看看  

Doubly Weak Supervision of Deep Learning Models for Head CT  

Cross-Modal Data Programming Enables Rapid Medical Machine Learning  

Multi-task weak supervision enables anatomically-resolved abnormality detection in whole-body FDG-PET/CT 

這三篇應該算重要收穫了。醫院放報告和影像一大堆,如果可以用報告加影像直接 train model 那做 deep learning 就會變得容易很多(謎之音:我也不用爆肝)。特別是有論文提到用 BERT 去把原始報告轉換成 study-level 的 label,現在有 LLM 可以用 few-shot 感覺這部份會容易很多。

全文連結

星期二, 4月 16, 2024

星期六, 4月 13, 2024

GPT-4 讀 paper 小感

GPT-4 真是讀 paper 神器。

Training Complex Models with Multi-Task Weak Supervision 這篇為例,中間小節開始引入集合操作符號就開始看不懂。靠自學 PR 值 < 0.1 的線性代數和數學符號認知,也完全看不懂抽象化後的 Material and Method。

交給 GPT-4 奇蹟出現。先用 LaTeX 把數學公式還原好,再整段丟進去,然後不管 GPT-4 回什麼,直接問 can you give me concrete example?,GPT 就直接解了抽象化,用非常簡單的例子就知道這段大概在講啥,過程中順便釐清我對大量符號的誤解,還有我對圖論基本名詞的認知錯誤。

看來 GPT-4 可以當成讀跨領域 paper 神器,效果遠勝我門外漢亂猜,前提是問題要問對。例如從 paper pdf 複製文字提問時,要用 LaTeX 把被破壞的格式還原 GPT 才知道你在講什麼
不曉得是不是 weakly supervised learning 這個主題 GPT 看過的文本夠多,才有這麼好的效果?可能要讀更多 paper 才能驗證。





 

全文連結

星期四, 4月 11, 2024

閱讀「投資別再情緒化!讓數據說話 用科學方法讓本金百倍奉還」

連結

這幾天看完這本,是淺顯易懂的好書,用直白的語言講量化交易的心得,並且提供了最基本可用的指標。遺憾是沒有 sample code 不過這也讓書變得更薄。

讀完這本感覺可以找 reference code 開始做 MVP 跑回測了 XD

全文連結

星期三, 4月 10, 2024

對二次元「兒童色情」、兒少性剝削與 iwin 的我見

Ptt 原文

改自本座拙著,最近 iwin 管制虛擬「兒童色情」和真實兒少性剝削鬧得沸沸揚揚。本座屬於「嚴打真實戀童,但反對同等嚴打虛擬人物」流派。

本座認為首先該做還是「正名」 

看二次元的不該叫做「戀童」

愛看電影殺人情節,但反對現實殺人的人不叫「潛在殺人犯」,哪怕他喜歡的電影殺人情節可以非常血腥讓人不舒服吐出來,跟真正的潛在殺人犯還是不同。

同理,只看二次元,但反對現實戀童的宅宅也不等於「戀童」。就算某肥宅真的看了很噁心的本子,只要該肥宅堅定反對侵害真人,那就不能跟真正的戀童癖混淆。

本座認為這一定要說清楚。如果 ACG 愛好者和肥宅們認為自己算戀童,只是屬於虛擬沒那麼嚴重 etc. 那先天就站在道德劣勢,你已經承認了自己有病,那保守派嚴刑峻法對付你幫你把病醫好不好嗎?
 

憲法、法律的「人」只包含自然人。

依據母法的定義、從法明確性來看,法律上的「人」就只能是自然人,否則就是重新定義人類,這點不細說。

國外規範虛擬色情的法律,會用 non-genuine sexual acts with minors(瑞士 Swiss Criminal Code)image of an imaginary child(英國 Coroners and Justice Act 2009)等詞彙,明文表示虛擬人物也屬於刑法的規制對象,這也佐證在刑法上,「虛擬人物」和「人」並不是相同概念,否則何須吃飽沒事幹換個詞明文表示?

反觀台灣,相關條文都是規範兒少的圖畫 etc. 條文從未明示將虛擬人物也納入管理,因此衛服部和 iwin 說虛擬人物也屬於兒少性剝削,純屬擴張解釋法律,顯不符立法原意。

大法官釋 617 同理,本座主張釋 617 規定人獸交屬硬核,其「人」僅限定於自然人。大法官從未在任何解釋將「人」的定義擴展到虛擬人物(大概也沒想到會有邏輯鬼才把虛擬人物也當人)。所以別再說二次元作品有可能觸犯釋 617 的人獸交了,頂多算軟芯猥褻物而已。否則當這麼說的時候你已經無形接受了「虛擬人物也是人」的錯誤概念,從而在接下來輿論戰失利。
 

保護真實兒童必須停止浪費預算

最近有幸終於投中一篇小社論。本座以為在目前這個風口,「打 ACG 是浪費貴重預算」是能被接受的。

日本 ACG 發達但性犯罪率遠低歐美。目前台灣無二次元導致兒少受害案件,兒少受害案無一是 ACG 導致。寶貴的預算和司法資源拿來管 ACG,只是在浪費珍貴資源甚至癱瘓司法人力

這跟賣偏方一個樣,賣偏方的說關心你父母得癌症,實際上是花光你父母錢讓他們錯失治療機會,買偏方的錢拿去買有效的自費治療搞不好父母多活幾年。打 ACG 的口說保護孩童,實際上是把有限資源花光,用在無法幫助孩童的地方,錢如果省下來去做有用的事,也許真實虐童案、真實兒少性剝削就能少更多件,阻止不幸發生。

嚴打 ACG 的保守派,和賣偏方的騙子,他們的關心和愛都假的。只是一個圖財,一個只想滿足自己的基督教宗教願景(也許有些人還有趁機擴權搞錢),才不管對兒童到底有沒有用。

全文連結

保護兒童「讓人兩難」?

出處

最近接連出現兒童受虐及兒少性剝削事件,加害者甚至與兒童保護單位關係密切,引起輿論關切,也有民眾和立委諸公呼籲修法。

筆者認為保護兒童,除了立法,也要提防賣「偏方」假友軍。有政府官員和宗教保守派,對持有真人性影片,有實際兒少受害的案件唯唯諾諾,稱其「讓人兩難」,卻對無實際受害者的虛構影視作品重拳出擊,揮霍兒童救命錢,就是賣偏方的假友軍。

賣偏方者口口聲聲為病人好,讓病人散盡家財,不只是讓病人做「無用功」,更讓病人錯失治療機會。政府預算花在無效治療的費用每多一元,能實際挽救兒童的經費就少一元。假保護兒童之名,卻把預算砸在安慰劑,實際上是戕害兒童。

打擊「湯姆貓與傑利鼠」無法減少虐貓。政府官員要績效,不是靠打擊虛擬人物濫竽充數、搞遮羞布。更何況主張嚴打虛擬人物的團體,尚且無法防止「自己人」虐童,信賴他們的「藥方」無異請鬼拿藥單。預算省下來,用在真正有用的措施,不知道能多救多少孩童?

-----

震聾發聵的好文,寫文章的作者一定是帥哥小鮮肉(?)

難得投稿中了一篇趕快慶祝一下 XD

全文連結

星期二, 4月 09, 2024

Mamba 架構介紹影片

【博士Vlog】2024最新模型Mamba详解,Transformer已死,你想知道的都在这里了

今天偶然看到的,號稱 transformer 殺手的 Mamba 架構。從影片看來,Mamba 優化了 transformer 的複雜度,並且更加考量到現有 GPU 架構,實現更快的推理,並且在實際應用上很多地方可以平滑的替代 transformer (謎之音:那些用 transformer 做過的 paper 可以全部再做一遍)。後面李飛飛大老的團隊 U-Mamba 實做 CT segmentation 擊中了我 Q<>Q 我連 transformer 都還沒全部弄明白呢,

先做個紀錄,也許以後可以發想一些 idea

全文連結

星期日, 4月 07, 2024

台中、鹿港遊

這次清明連假,和父母一起去台中、鹿港玩,稍微紀錄一下。

劍湖山世界,行程乏善可陳,主要是我和母親都很怕雲霄費車類要大心臟的遊樂設施,所以大部分設施就純看不玩 XD

鹿港夜景就蠻漂亮,很有台灣風味。

 
 
 
 
 
 
 
 
 
 
 

白天的鹿港老街景點。
台中分子藥局,打卡重要景點,但純粹路過拍照不進去 XD 
國家漫畫博物館,很多懷念老物。沒想到月詠也老到可以畫在博物館牆上了,neko mimi mode~ 

全文連結