禮拜天想衝個文章進度,發現一不小心就寫破 10000 字了,然後整天都不見了!而且還沒辦法收尾,明天只能跟合作夥伴說聲歹勢。現在很慶幸,當初對出版社申請延長三個月(最大值),現在剩不到一個月。如果當初只寫一個月,現在就得 reject 。感覺即使有 GPT 加持,我的學術能力看來還是垃圾級。
另外,GPT 的學術和研發能力真的是遠超過我,不會做的實驗,例如怎麼分析 BERT 的 bad performance,問一下 GPT 然後對個文獻排除幻覺,就能照表操課了。我的研究問題用 GPT 和 BERT 表現很差,我把症狀講一講 GPT 竟然說出了我自創的 ensemble method 還順便推測為什麼這個方法表現會更好。請 GPT 指導的時候,還可以 prompt「你是醫學資訊領域 Q1 期刊嚴格甚至嚴苛的主編....」然後 GPT 就能像真人一樣,把你定到飛起來,整個人在空中螺旋打轉,嚇的我趕快說我只要投 Q2 (IF=2.1) 期刊而已,麻煩神通收一收。
大模型這麼好用,下一篇(淦!)研究計畫 or 合作主管年底建議我請的科技部計畫(淦!)乾脆請 GPT 或 Google deep research 老師來擬稿,我來補充好了,最好可以當個無情的實驗執行機,照 GPT or Gemini 老師的指導做完實驗就能發了 :P
星期日, 8月 17, 2025
星期一, 7月 21, 2025
星期五, 1月 17, 2025
狼途 GK 65 入手
今天順利入手狼途GK 65。新筆電天選 5 pro 現在用得很滿意,螢幕大顏色漂亮、有獨顯、重量可接受,就是輸入設備受限於筆電先天限制。難用的觸控板已經用外接滑鼠替代,但難按的薄膜鍵盤一直沒很好解決,機械鍵盤保證好按,但出遠門帶鍵盤太麻煩。
後來靈光一閃,想到帶小鍵盤,就決定 68 配列挑一把,這是有方向鍵(方便玩遊戲)中最小的配列了。這把狼途 GK 65 在淘寶買含運不到 NT$600,就想都不想入手了。1/10 下單,1/17 就收到貨囉,啪的一聲很快啊,本來還擔心趕不上月底出門玩。
拆開後,紙箱外觀非常一般,充滿廉價感,不過考量到非常低價就不要求,裡面除了鍵盤、填充物就只有一張說明卡和貼紙,實在精簡。鍵盤入手後馬上發現有怪聲,今天吃完尾牙花時間拆開發現底層有個冗餘螺絲,移除後怪聲消失,想想只賣 NT$600 還是不計較了。
我買的版本為金軸,查了下是段落軸,聲音偏大,大到會不好意思在醫院高速打字,打感非常清脆。整體大小則非常滿意,跟原本 98 配列狼蛛 F99 比又小非常多,大小應該可以塞進背包了。
下次出遠門找機會帶出去,如果能放背包,就能實現筆電用外接機械鍵盤打遊戲的夢想 XD
星期日, 1月 05, 2025
淼論文工具組合拳
我好像發現很有用的廢文產出工具組合:Word 聽打、ChatGPT 機翻、DeepL Write 選字,最後丟進 Grammarly 專業版改字改文法,順便做抄襲和 AI 檢測。
Word 聽打是新發現的速度起飛關鍵,只要會唸口語化中文,中間可以貼點別人的英文,像這個 sentence 中英 mix together 口語化 is fine,不用考慮太多,慈祥的ChatGPT 都看得懂,祂,都懂。記得prompt指定「學術用」英文,依必要做 paraphrasing。後面 DeepL Write + Grammarly 專業版大改,再段落重排,從口語論述順序改成論文和證明的論述順序,一坨原創文章就完成了,而且什麼抄襲或 AI 檢測都找不到問題,真被 highlight 就請 GPT 想十個 alternative 加上自己破英文修改,Thesaurus 是什麼?好吃嗎?
至於所謂「研究用GPT」工具根本沒必要。我只用 NextChat 搭配 API 呼叫。Prompt 最後都寫在 Autohotkey 裡,要用時跟超魔專長一樣全部瞬發,那些工具只要看一下它們的 prompt 就好,沒必要還得自己裝 Python,弄環境,處理一堆問題。Grammarly 貴可以找網拍找 Business 版團購。其他替代工具,例如 Quillbot,用起來效果很差,機翻不如 GPT+自製 prompt,選字改文法不如 Grammarly,用不到三天果斷退費。DeepL 免費版翻出來的內容則不像學術用英文。
用了這套組合拳,淼 paper 速度又比以前更快了,這陣子瘋狂趕稿,光今天就用這套方法噴 1.2k 個字。
當然,這個方法無法治療研究 idea 本身的貧乏以及研究者本身素質低下,例如某兼差 researcher 只會稍微改問題,用 unique data 在稍微不一樣的問題做大樣本 validation,方法原理數學一概不懂,做不了底層創新,除了工人智慧和舌燦蓮花更無別法。寫到 5.6k 字的稿子給指導者看,馬上就被定 reference 數量不夠、因此 literature review 以及 discussion 也不夠。
題外話,這次寫稿還趕上生病,請假回來後 atopic dermatitis 又發在臉上,還好現在有所改善。應該慶幸不是在放假時生病,至少「趕稿」和「生病」這兩件事可以排在一起只佔一份時間。比較擔心文章用的方法不夠 novel 問題不夠複雜,論文投不出去,希望修改和投稿順利 QQ
星期三, 12月 25, 2024
MSC 榮耀號日本跳島
這次休假,又和家人再一次搭上MSC榮耀號郵輪。
這次行程是日本跳島,只有去日本,地點為宮古島、那霸、石垣島。
第二次上郵輪,發現郵輪好像基本上沒什麼變化,佈景不能說大體相同,只能說一模一樣。餐廳部分,櫻桃餐廳還是非常高級,而且維持免費,但是份量非常少,主餐還變得不能無限加點。所以如果要吃飽,只能在櫻桃餐廳吃飽後,再去 15樓的Buffet吃量大管飽的便宜美式食物,像是披薩、麵條等
這次岸上旅行,宮古島部份因為島上交通不方便,我們又人生地不熟,所以我們選擇跟榮耀號的團,結果行程十分陰間。日本時間早上八點,相當於台灣早上七點就要起床,起床的時候就覺得整個人像是會動的殭屍,然後旅遊景點基本上有意義的只有一個天文台、一個漂亮的沙灘海岸,剩下就是在坐車、購物中心還塞了兩個,整體而言:差評。
那霸和石垣島就選擇了自助的形式,不過因為還是人生地不熟,而且兩者岸上交通都不方便,石垣島連電車都沒有,重要景點搭巴士都兩小時以上,就都只有玩郵輪附近鬧區而已。兩者基本上都是:下郵輪、坐接駁車或者是巴士、到鬧區然後吃東西、吃完附近街道看一下,然後就回去船上。不過石垣島有吃到道地石垣牛,入口即化,口齒留香,吃完喝個茶之後,嘴巴完全沒有任何殘留油膩味,超級好評。
船上娛樂設施種類也沒什麼變化,好像沒有明顯新增加設施,船上免費的倫敦劇院表演水準依然很高,但是一些曲目印象中好像上一次來的時候就聽過了,不曉得舞蹈部分有沒有換。之前覺得很有水準的娛樂總監好像換掉了,整個節目長度好像也有稍微縮短,不曉得是不是cost down。
下船當天,又再度要早起,然後在台北玩了一天,看了動漫,天瓏書局、然後回房間水點 paper,就回來收假上班。
星期三, 11月 06, 2024
GPT 研究吐苦水
看到討論 GPT 的文章,想到自己快炸的研究。
最近被 GPT4 坑,比較放射科報告內文和醫囑做 anomaly detection,將報告分成正常、異常兩類。本以為是 low hanging fruit,只要調 prompt、call GPT4,就能有不錯成績還兼顧可解釋性,就能迅速生產研(ㄒㄩㄝˊ)究(ㄕㄨˋ)瑰(ㄌㄜˋ)寶(ㄙㄜˋ)整理投稿,達成工程職業績,可喜可樂~因為看好這個議題,個人還標了 3 * 10000 個 label 確保未來能夠投稿。
豈料 GPT4 表現極慘,正負平衡的樣本 F1 只能做到 0.7x,如果是正負比 100:1 的 real world data 成績就更慘不忍睹。幾個月的努力要打水漂,並且支票要跳票,只好絞盡腦汁想辦法改實驗,用 BERT 做 sentence contradiction、更古老的 TF/IDF + ML、非監督式方法、各種策略都試過。
結果,最後最好的方法竟然是 rule-based parser,用工人智慧建立大表格做 dictionary lookup,只要 lookup table 夠大塞好塞滿就什麼都能判斷。算法和 lookup table 一路修改下 F1 score 從 0.1X 拉到 >0.85,正負平衡樣本還能作到 F1 = 0.99 還抓到不少 mislabeled data。結論:傳統 rule-based parser > fine-tuned BERT > GPT4。
問題好像解了(至少研究上),但這種結論怎麼解釋又是頭痛的問題,希望能順利投出 orz
全文連結星期二, 7月 23, 2024
星期日, 7月 14, 2024
天選 5 pro 入手!
換新筆電值得紀錄 XD
之前出去玩,舊筆電 Lenovo T460 (2016)14 吋開 VS Code 寫程式眼睛吃力。決定換大螢幕筆電。
新機為華碩天選 5 pro,螢幕 16 吋、16:10 窄邊框最大亮度 400nit,2.2kg、螢幕大夠亮機器也不會太重,獨顯由 T460 的 940M 飛昇為 RTX 4060(Mobile)性能增加超過 10 倍。今天帶出門標資料感覺眼睛負擔輕多了。小缺憾是續航力比不上 9-cell 電池加持的 T460,約四小時上網、開 VM、標資料就剩 3X% 電,得買行動電源。
最後,台灣筆電價格實在是貴。相近規格 TUF F16 台灣可能要買 46K,螢幕規格還較差。京東買 40K 左右,有國際保,螢幕參數更好,有更多規格、顏色可選。至於簡體中文系統自己重灌就好。
星期二, 6月 18, 2024
帶點缺憾的郵輪行程
這次郵輪行程還包括韓國的濟州島和日本的鹿兒島,每個地方我們都上岸玩了一天,體驗當地風土人情。日本鹿兒島跟團行程有點太緊,三個景點,最後一個還是購物中心!感覺就第一個點晃了下建築,吃個點心,就趕去吃飯了。吃飯因為人數太多,每個店都需要排隊,導致寶貴上岸時間就耗費在排隊上。購物中心行程就...。
韓國濟州島因為團沒開成,倒是可以自由行,我們請了導遊小姐,帶我們看三個點。行前功課沒做足,第一個濟州島去的濟州民俗村其實不合胃口,類似特別去看古早農村,還遇到推貨的導遊,車程還要一個小時!之後導遊帶我們去看的商店街和購物中心尚可。但後來想想,應該就直接找碼頭附近景點最密集的地方,一路密集看過去就好。但整體而言,韓國相比日本,應該不會更想再來 XD
船上的收費就是讓人肉痛的事情了。帳單有一半都是網路費!郵輪上只有衛星網路,當我在頁面上選購上網套餐時,看到的價格是每套設備單價 $15 美元(買 3 台)或 $14 美元(買 4 台)。我想說價格看起來不貴,為了玩的盡興,就買了四台設備的額度,其中一個額度算是給家人備用。結果,這個價格竟然是「每24小時」的價格!實際價格是那個數字乘以5!也就是說,4 台網路「整個航程」的價格是 USD$280,相當於 9,000 多台幣!看到帳單的那一刻,我差點吐血。但後來想想,其實在郵輪上不上網路也是不太可能的,至少我和家人還有筆電共三個份額是必須的。但如果只買三個份額,應該可以省下一兩千元。
最慘的是,旅途中我還生病了,可能是飲食沒控制好,皮膚異位性皮膚炎復發,面積不大但直接發在臉上。現在收假上班還是要一兩分鐘毛巾溼敷一下臉,再擦個乳液,不然臉像螞蟻爬似的,沒辦法專心工作。每天晚上十點多就睡覺,吃了好幾天的素菜,乖乖喝中藥調理身體。
排除這些問題,這次旅行還是非常棒。船上的飲食、表演遠超預期。免費的劇院表演我覺得可以直接地面上開團了,呆在船上真的委屈,只有第一天能預約到表演,第一天的演出之後每天的額度一釋放就被秒殺。免費 buffet 幾乎隨時可去吃,免費單點的餐廳也是超過水準,義大利麵、羊排....對標地上的話應該有相當千元一餐或以上的口味,還能無限續盤。剛上班幾天就又開始想放假了 XD
星期六, 6月 08, 2024
地中海郵輪上船第一天
久違的放假,陪家人一起搭船旅遊。第一天就在交通中度過,老家出發、高鐵、找船、登船。中間順便搞定手機投保等瑣事很快就下午了。中間手機訊號不好,整網路投保不停失敗整個人焦慮好久,還不小心弄壞氣氛 >"< 後來躲到窗戶旁邊訊號恢復才搞定。這之後趕快買了船上 wifi,雖然訊號還是很爛但總算是有網路了 Q<>Q
第一天行程以船上閒逛為主,看了不少店,但沒買什麼東西,物品普遍都價格偏貴 QQ 晚餐的歐美台混合風格 buffet 水準在預期之上,如果再額外考量這不用額外付費其實是佳作,而且這裡開很晚,其實完全可以別的店晚餐沒吃飽,再到這裡補點東西 XD。
如果晚餐是超出預期,那之後十點十五分看的 show 就是驚喜,各種百老匯式名曲歌舞接連登場,根本沒感覺時間流逝就已經十一點表演結束。據說每天會有不一樣的節目,打算問問能不能錄影,如果能的話要用手機留念了。
星期一, 6月 03, 2024
跟 1fichier 再見
延續這篇。母校要限縮 Google 教育版無限空間, 2T 左右資料要想辦法找地方放。原本對 1fichier 非常期待。但這個月使用狀況不理想。
我有兩個大資料夾,一份以投影片和文件、大檔為主,另外一個有大量圖片小檔。前者在 1fichier 使用很順利。但後者傳了一個月還沒辦法傳完!看 rclone logs 一直傳 403 Flood detected: IP Locked。爬了文章才知道 1fichier 對於 API call 非常吝嗇。大量複製小檔免不了頻繁 call API 然後就被後端反覆限流。試著調了 --transfers、--tpslimit、--checkers 等參數都沒有用。有考慮過 iDrive Personal,也很便宜,很遺憾不支援 rclone,只有 iDrive e2 object storage 才支援,但它沒給 5TB 的選項。決定先試用 jottacloud 這家,有無限空間,只是超過 5TB 後逐步限速,看來夠用了。
目前先買一個月,landing page 用歐元計價是 €9.92/month,但實際刷卡的時候變成美元計價 11.9/month 但年繳會送兩個月,這樣就沒比 Onedrive 6TB 貴太多,先試用看看。若一個月沒出問題就轉年繳。
全文連結星期一, 5月 06, 2024
資料搬家
看到母校公告,校友 Google Drive 要從無限空間直接縮到 1G,只好準備告別,設法幫 2T+ 資料搬家,結果空間挑好久。
星期五, 4月 26, 2024
機動戰士鋼彈SEED FREEDOM
今天抽空去看 Seed Freedom 4DX,好看!
已經忘光原本劇情還是看得很愉快,但哪怕忘了劇情還是充滿情懷感。
這部 4DX 真的像駕駛艙,第一次看電影感覺快被椅子甩出去。
最後,粉紅妖女的滿級嘴遁真的噁心,爆種以後感覺嘴遁也有加成 XDDDD
星期一, 4月 22, 2024
星期六, 4月 13, 2024
GPT-4 讀 paper 小感
GPT-4 真是讀 paper 神器。
以 Training Complex Models with Multi-Task Weak Supervision 這篇為例,中間小節開始引入集合操作符號就開始看不懂。靠自學 PR 值 < 0.1 的線性代數和數學符號認知,也完全看不懂抽象化後的 Material and Method。
交給 GPT-4 奇蹟出現。先用 LaTeX 把數學公式還原好,再整段丟進去,然後不管 GPT-4 回什麼,直接問 can you give me concrete example?,GPT 就直接解了抽象化,用非常簡單的例子就知道這段大概在講啥,過程中順便釐清我對大量符號的誤解,還有我對圖論基本名詞的認知錯誤。
看來 GPT-4 可以當成讀跨領域 paper 神器,效果遠勝我門外漢亂猜,前提是問題要問對。例如從 paper pdf 複製文字提問時,要用 LaTeX 把被破壞的格式還原 GPT 才知道你在講什麼
不曉得是不是 weakly supervised learning 這個主題 GPT 看過的文本夠多,才有這麼好的效果?可能要讀更多 paper 才能驗證。
全文連結