ChatGPT 真的是越來越強,生態系也比以前更成熟。我之前成功地用 GPT-5 進行 Vibe Coding,現在用它來幫我讀 Paper 的效果也非常好。我使用的 LobeChat,搭配 GPT-5 可以將 PDF 、檔案或圖片直接發送給大模型,讓它幫我讀論文,省去了我手動從 PDF 中抄文字、校正 LaTeX,然後再貼到大模型 的繁瑣步驟,讓我提問的效率大幅提升。GPT-5的總結能力也很強,只要告訴它我是大學生,現在只是學過大學程度的 deep learning 和哪些數學,再請 deep research 幫我制定 step by step 學習計畫,教我如何深入理解某篇論文。GPT 真的能把文章一步步拆解成我可以吸收的樣子。
這次試用目標是 Weakly-supervised Medical Image Segmentation with Gaze Annotations 這篇論文。因為我業務跟影像有關,對於 Computer Vision 和 Weakly Supervised Learning 有興趣。不過這篇論文我自己看完全看不懂。Deep research 和 GPT-5 拆解後真的能看懂了。這篇論文的核心其實就是訓練多個 Weakly Supervised Network,根據不同的粒度的 pseudo-label 訓練不同的 classifier。這些不同的 classifier 會使用一些特殊設計的 loss function 達成一致,以避免對 noise 的 overfitting。Core idea 其實幾句話就能講清楚,但自己看就是看不懂。
用 GPT 加上自己驗證,可以避免卡在鬼地方。沒有 GPT,光一句 Current noise-robust approaches are based on the symmetric or asymmetric assumptions of simulated noise...的 symmetric 是什麼意思,就要查半天,一個點就吸乾全部精力。又例如本文 isotropic Gaussian 和 dense CRF 的應用,我完全沒有學過相關數學和 Computer Vision 知識,所以根本無法看懂。請 GPT 解釋後大概明白其實它只是對 pseudo-mask 做微調,很快就能過掉難點。如果自己看就會卡在這,還以為這是重要的核心方法。
這次實驗非常成功,接下來我應該會用這個方法快速過掉自己感興趣的論文。目前有一些論文提醒服務,像是 StorkApp,可以自動找出我感興趣的論文。靠這個方法,希望就算沒有在博士班學習,也能快速跟上研究動態。
全文連結
訂閱:
張貼留言 (Atom)
0 意見:
張貼留言