這影片說到心坎裡了,模型縫合怪和方法移植,然後附上花裡胡哨的性能對比正是我最愛幹的事情。甚至我連縫模型的能力都沒有 QQ
重點:做研究別想一步登天。永遠先問自己三個問題
1. 當前問題的根本在哪裡:領域經典論文有沒有讀懂、讀透?
2. 現有方法的痛點在哪裡?
3. 你的解方是什麼?解方是針對哪個痛點設計?和別人的方法比起來如何?
星期二, 9月 02, 2025
星期日, 1月 05, 2025
淼論文工具組合拳
我好像發現很有用的廢文產出工具組合:Word 聽打、ChatGPT 機翻、DeepL Write 選字,最後丟進 Grammarly 專業版改字改文法,順便做抄襲和 AI 檢測。
Word 聽打是新發現的速度起飛關鍵,只要會唸口語化中文,中間可以貼點別人的英文,像這個 sentence 中英 mix together 口語化 is fine,不用考慮太多,慈祥的ChatGPT 都看得懂,祂,都懂。記得prompt指定「學術用」英文,依必要做 paraphrasing。後面 DeepL Write + Grammarly 專業版大改,再段落重排,從口語論述順序改成論文和證明的論述順序,一坨原創文章就完成了,而且什麼抄襲或 AI 檢測都找不到問題,真被 highlight 就請 GPT 想十個 alternative 加上自己破英文修改,Thesaurus 是什麼?好吃嗎?
至於所謂「研究用GPT」工具根本沒必要。我只用 NextChat 搭配 API 呼叫。Prompt 最後都寫在 Autohotkey 裡,要用時跟超魔專長一樣全部瞬發,那些工具只要看一下它們的 prompt 就好,沒必要還得自己裝 Python,弄環境,處理一堆問題。Grammarly 貴可以找網拍找 Business 版團購。其他替代工具,例如 Quillbot,用起來效果很差,機翻不如 GPT+自製 prompt,選字改文法不如 Grammarly,用不到三天果斷退費。DeepL 免費版翻出來的內容則不像學術用英文。
用了這套組合拳,淼 paper 速度又比以前更快了,這陣子瘋狂趕稿,光今天就用這套方法噴 1.2k 個字。
當然,這個方法無法治療研究 idea 本身的貧乏以及研究者本身素質低下,例如某兼差 researcher 只會稍微改問題,用 unique data 在稍微不一樣的問題做大樣本 validation,方法原理數學一概不懂,做不了底層創新,除了工人智慧和舌燦蓮花更無別法。寫到 5.6k 字的稿子給指導者看,馬上就被定 reference 數量不夠、因此 literature review 以及 discussion 也不夠。
題外話,這次寫稿還趕上生病,請假回來後 atopic dermatitis 又發在臉上,還好現在有所改善。應該慶幸不是在放假時生病,至少「趕稿」和「生病」這兩件事可以排在一起只佔一份時間。比較擔心文章用的方法不夠 novel 問題不夠複雜,論文投不出去,希望修改和投稿順利 QQ
星期二, 10月 01, 2024
如何寫好一篇論文(10) - 如何從文獻推出自己的論點
- 從文獻出發,推出自己的觀點
- 寫作終極目的:為讀者創造價值,不是為了證明自己。要以服務讀者為中心
* 推出自己論點前,把各方面情況掰開揉碎給讀者,幫讀者自己判斷,自己的意見當成參考意見,在讀者獲得充分信息之後再呈給讀者,反而有好影響力
- 五段落寫作模板
* 第一段:分析、分解問題。幫讀者問題分析和考量我們面臨問題的各種不同方面,各種不同角度
* 第二、三段:對不同方面、不同角度組織文獻資料分別進行討論。
# 例如第二段講正方,第三段講反方,並在兩者間達成平衡
* 第四段投入核心論點、關鍵砝碼,打破平衡,實現影響力
* 第四段要補充、提昇讀者現有認知或文獻討論體現的認知
# 例如一直以來認為重要的,你認為是次要的
# 大家認為是複雜的問題,但你看出簡單的邏輯
# 不同角度切入問題,發現新的威脅、機遇、衝突
# 現有衝突中發現新的關鍵問題、解決方案
* 第五段:對第四段提出的論點進一步發揮
- 先建立平衡,再打破平衡的模式,類似古代謀士,先提出上中下三策分析利弊為君主提出充分信息,顯示自己考慮問題細緻和客觀公正。最後只要關鍵處輕輕一點、就能打破平衡、影響決策。
星期四, 4月 25, 2024
網路文章:投期刊返修寫Response的時候,應該寫詳細一些還是簡要點?
知乎上很好的文章,擷取重點:
1. 所有的回復目的只有一個:說服 Editor,必須解決所有審稿人的疑慮,突出文章的貢獻。
2. 如何得體又有理有據的回覆強硬拒絕的審稿人
3. 一定要對 Editor 說一些好話,這要在整體回復審稿人意見之前寫上去。
得體回覆審稿人的模板:We appreciate the reviewer for carefully reading our manuscript and makingtheir insightful, critical, and constructive feedbacks. We appreciate that their comments have enabled us to prepare a greatly improved manuscript.(誇他) However, we respectfully disagree with the assessment of this reviewer regarding ourinnovativeness,analysis, and conclusions that the (自己的東西) is a common and unconvincing architecture. (反對他)We apologize for the previous poor formatting and some disputed descriptions of our manuscript, which may have made some of this evidence unclear. (對自己文章不足進行道歉)For this reason, we have revised the statements in our introduction and discussion to better highlight the novelty and advancement of our work.(改進並指明亮點)隨後對自己的亮點進行總結說明,包括那幾點
星期日, 3月 31, 2024
如何寫好一篇論文(09) - 文獻分析的三種邏輯推理方法
- 有說服力的邏輯推理方法大體有三種:歸納、演繹、溯因
- 可對文獻資料進行分析來推出自己的論點,例如衝突、解決方案等
- 也可以用於論文的討論和結論
- 歸納 inductive reasoning
* 由點到線,發現新的規律
* 對各種不同的資料進行歸納總結
* 由個別的證據推斷出一般性的規律
* 人類幾乎所有的知識都來源於歸納
* 常見的方式有求同和求異兩種
# 求同:找出各種不同文獻資料之間的共同點,推斷出較為普遍性的規律
# 求異:比較各種不同文獻資料之間的不同點,找到造成這種不同的關鍵因數或者是變量
- 演繹 deductive reasoning
* 由一般到個別,建立新的證據
* 文獻中已經總結出某種一般性的規律
* 結合我們當前實際情況
* 大前提 -> 小前提 -> 結論之三段論屬於演繹推理
- 溯因推理 abductive reasoning
* 由點到虛線的推理方法,提出新的假說
* 科學的前沿探索的過程中文獻中證據往往是雜亂而不完整
* 由已知的所有線索排除各種可能性從而最終推斷出真相和最有可能的解釋
* 從一堆看似雜亂無章的事實中獲得洞見
* 比歸納和演繹更需要創造性思維,類似偵探破案
* 要求研究者對於各種可能性有深刻的認識
* 結果一般是新的假說,需要進一步的實驗論證
- 推理方法為退化的歸納、演繹法,並不嚴謹
- 語文教科書的舉例論證、引用論證、比喻論證、對比論證等傾向修辭學而非真正的邏輯推理方法
星期日, 3月 24, 2024
如何寫好一篇論文(08) - 用故事邏輯寫文獻綜述
- 文獻綜述
* 引導出我們自己的研究目標
* 用文獻來支撐我們的自己的研究目標的重要性和合理性
* 用講故事的邏輯來寫我們的文獻綜述,需要有起伏
- SCQA 模板
* 情境、衝突、關鍵問題、解決方案
* 可以包含多重起伏
# 例如 Background and history -> 衝突1,解決方案1 -> 衝突2、解決方案2 -> ...-> 最終遺留問題
# 最終遺留問題可作為 future direction
* 可根據狀況調整順序
* 關鍵問題和解決方案已可被讀者接受 -> 開門見山 QASC 或 QACS
# 首先提出關鍵問題和解決方案直接點名本篇論文的研究目標
# 隨後再慢慢的介紹情景和沖突
* 追求衝擊力 -> CSQA
# 首先提出沖突引發讀者的關注
# 隨後再介紹前情和後續的解決方案
* 情境(S)
# 實現和讀者的對接,取得讀者的基本的信任
# 挑出文獻中最不具爭議讀者最容易認同的部分來寫
* 衝突(C)
# 起伏的開始
# 可能是一個顯然的挑戰
# 也可能是通過文獻分析才能夠發現的一個潛在的威脅或者機遇
* 關鍵問題(Q)
# 作者需要明示出解決所提出沖突的關鍵點在哪裡
# 往往最能體現出作者的眼光
* 解決方案(A)
# 一個有說服力的解決方案就能自然地帶出本篇論文的研究目標和它存在的意義
星期四, 2月 29, 2024
閱讀文獻過程中的三要和三不要
- 三不要
* 不要做無選擇的精讀
# 尤其是文獻閱讀的第一階段(泛讀)
# 不能因此忽略關鍵文獻
* 不要只讀不寫
# 尤其是在文獻閱讀的第二個階段(精讀)
* 不要讓資料來源不清
# 每次紀錄一條有用的信息,都要紀錄來自哪篇文文章
# 要引用卻想不起來源,會非常困擾
- 三要
* 列表法
# 做表格,把不同文件的類似資訊羅列在一起比較
# 整理大量的資料時特別有用
* 畫圈法
# 把文章論點用幾個字畫一個圈
# 能支持此論點的文獻或其他論點,用一個箭頭與該圈連起來
# 每一個論點都最好能找到有相關文獻支持
# 一個文獻能夠同時支持多個分論點
# 所有分論點或文獻最終都應該能夠指向我們的總論點
* 寫自己的摘要
# 為別人的論文寫我們自己看的摘要,紀錄在別人的論文中
# 寫對我們自己研究有用的部份
星期六, 10月 14, 2023
星期日, 10月 01, 2023
如何寫好一篇論文(06) - 閱讀文獻的兩個階段
- 文獻閱讀大體上分為兩個階段,兩個階段可能多次循環
- 第一階段
* 目的:明確和細化我們的研究目標
* 找尋研究目標的合理性和重要性
* 泛讀、從厚到薄
* 要很廣泛的讀,需要讀得快、有選擇的讀
* 讀一些相關的專業的課本或好的文獻綜述
* 累積與研究相關,較為普遍的大問題的知識
* 收集可以進一步精讀的素材
* 摘要->結論->引言->方法、結果
* 根據得到的新知,對具體研究目標修訂、細化,研究方向跟文獻更相符、更有貢獻、力量
* 眼光要大,切忌被低質量論文、不重要細節牽著鼻子走
* 累積和具體研究目標相關的知識、搜集可用具體素材
* 看過上百篇可能只有十幾篇和最終選定的研究目標密切相關 --> 精讀
- 第二階段
* 已經有了更明確、細化的研究目標,對下階段要閱讀的文獻進行精選、排序
* 目的:在文獻中收集可用的論據
* 精讀、從薄到厚
* 帶著目標去讀、讀的全、讀的細
* 要找出論證我們論點所需要的答案和證據
* 不僅讀出作者明確寫出的東西、更要讀出沒有明確寫出來的東西
* 區分隱含的前提、假設
* 區分何為觀點?何為事實?
* 讀作者的結論,還要去看他的結果和數據
* 根據自己判斷做出自己結論
* 需要做大量的筆記
星期二, 6月 27, 2023
如何寫好一篇論文(05) - 文獻綜述的兩個基本點
- 引言需要論證目標合理性,文獻綜述可以支持理性
- 文獻綜述要有「學」和「思」
- 學而不思則罔思而不學則殆
- 文獻綜述的「學」
* 包括「所有」「相關」「主要文獻」
* 證明我們已經全面了解相關知識
* 若遺漏任何重要文獻,代表不專業、研究建立在錯誤基礎上
* 引用文獻必須「全」「新」「客觀」
# 客觀:觀點不相符的文章,不能因為立場視而不見
- 文獻綜述的「思」
* 沒有思考,就只是複述他人觀點
* 兩個層次思考:批判、分析
* 批判:有效性、可靠性、優勢、劣勢、侷限性、顯著性、重要性
* 分析:透過自己的分析:歸納總結、發現規律
# 文獻資料和具體情況做演繹
# 透過溯因分析建立自己假說
# 透過共同點分析找出背後規律
# 透過不同點分析找出關鍵因子
# 透過比較文獻,找出現有研究空白,找到研究機會
- 要「六經注我」,用現有文獻支撐自己研究
星期日, 3月 26, 2023
如何寫好一篇論文(04) - 確立研究目標的兩個原則
- Foundamental Problem
*「大處著眼」:有意義的大事業,使我們的工作有意義,使我們可以成長
* 研究終點站,為研究指明方向
* 宏偉的城堡,通常和許多研究者共享
* 來自真實市場需求:專家建議、科研基金服務宗旨
- Objective
*「小處著手」:雖然是小事,只要朝正確大目標前進,長期累積或與旁人研究疊加,就能造成大影響
* 研究里程碑,為本篇工作指出評價標準
* 一塊磚頭,通常由我們獨享,可能很小
* 根據我們的資源、條件制定合理的目標
- Introduction 就是把「小事」和有意義的「大事」連結
- Introduction 從普遍的大問題,或眾人認同的大目標出發,發現關鍵需求逐步細化,訂出合理當前目標
- 論文主體,透過當前目標,制定具體任務,得到具體研究結果
- 論文結論,將研究結果與研究目標相比較。再論述當前目標完成後,對長遠目標的貢獻,得到完整論文
- 要能夠論述長遠目標、和當前目標的關係,有效說明當前目標的合理性,要做好文獻綜述
星期日, 3月 12, 2023
星期二, 2月 21, 2023
星期四, 2月 09, 2023
用 AI 修英文可不可行?
近期,ChatGPT 受到了非常多的關註,各種應用被開發出來,甚至很多人使用 ChatGPT 寫論文,引發爭議導致許多期刊禁止使用。但是真的完全不能用嗎?個人認為未必。ICML 的規定值得參考。ICML 是禁止使用 ChatGPT 的頂級會議,有詳細說明不可以使用的原因:
連結
The Large Language Model (LLM) policy for ICML 2023 prohibits text produced entirely by LLMs (i.e., “generated”). This does not prohibit authors from using LLMs for editing or polishing author-written text.
The LLM policy is largely predicated on the principle of being conservative with respect to guarding against potential issues of using LLMs, including plagiarism.
我認為用 ChatGPT 進行輔助性作業,例如:換句話說,化繁為簡,改善用字....還是可以的。前提是原創文字來自人類,ChatGPT 只是輔助。
禁止使用 ChatGPT 的主要原因是原創性和正確性問題。首先,論文作者必須能對研究質量進行最終把關並負責。ChatGPT 無法負責其正確性的把關,因此不能擔任作者,也因此只有人類才能成為作者。
其次,如果研究人員使用 ChatGPT,生成具有原創性的文字。由於 ChatGPT 不能擔任作者,理論上作者應該要列入發明ChatGPT 的人或提供訓練數據的全體人類。但由於明顯的原因不可能做到。這導致實際貢獻者沒有出現在作者名單,引發抄襲問題。
把握住根本原則後,再來看 LLM 的使用。在 AI 只是幫忙「打磨」文字的場合,文字本質是由人類作者原創,AI 幫忙編修並不減損人類的原創性及貢獻,並且最終品質仍有人類負責把關,所以無上述原創性、正確性問題。
現有很多服務、包含 DeepL、Grammarly 等也提供自動修改人類文本的功能,他們在現在和未來也可能使用 deeplearning 或 LLM,但我想不會有人認為有問題。因此,如果是
把 ChatGPT 當成高級翻譯或自動編修軟體來用,倫理上應該是沒什麼爭議的。最多被問的時候再指出有拿 AI 做 text polishing 或 paraphrasing。
最後不得不說,DL/LLM 真好用。我現在寫論文 DeepL、DeepL Write、ChatGPT、
Grammarly 四大守護神獸交替使用。中文底稿弄好,先丟 DeepL 機翻,人工小改,請
ChatGPT 潤筆重排、再丟回 DeepL Write 清潔,最終結果 Grammarly 大英修。文章的生產速度和質量都比預期好很多。
P.S:本文有用 ChatGPT 小潤筆 XD
星期二, 1月 24, 2023
如何寫好一篇論文(03) - 研究選題的三種途徑
- 回答正確答案需要「點」的知識,問出正確問題需要「面」的知識
- 問出正確的問題,科研就成功了一半。
- 確立新研究課題有三種途徑,可單獨或混合使用
* 填補研究空白
# 針對已被廣泛認可的老問題
# 通常具備技術挑戰性
# 重要的是「創新」,如新的解決方案、其他領域借鑒想法
# 需了解前人做過什麼,我們有何不同,我們貢獻和他人怎麼配合
* 延伸現有研究
# 追蹤研究歷史,一項接一項的成就
# 牽涉新問題和新領域、更多的新機會
# 新研究者容易迷失
# 須牢記長期目標,時時自問研究有何意義,對受眾有何貢獻
* 把成功研究在不同情形進行複製
# 成功研究,換不同變量、不同樣本群...
# 這是相當常見、普遍且相對安全的方法
# 需避免複製過程中可能發生的錯誤
- 好研究課題的要件
* 具體、可行
# 所有術語、變量都有明確定義
# 整個課題有明確的邊界
# 不存在先入為主的假設
# 適合現有的資源條件
* 開放、可爭議
# 不可證偽的課題不科學
* 能夠激發創新
- 最牛的兩種課題
* 研究者填補了當前所有的漏洞,此課題無可再做
* 突破了目前的知識框架,為更多機會打開新的大門
星期日, 1月 01, 2023
如何寫好一篇論文(02) - 引言的邏輯解析
- 引言可拆成兩段:第一段研究機會和第二段解決方案
- 第一段
* 從普遍的大問題(Problem)開始,到一個研究空白或問題(Question)結束
* 說服讀者,為了解決某個大問題,我們必須解決某個具體的研究問題
- 第二段
* 透過建立清晰的研究目標,去填補第一段建立的研究空白或問題,佔領研究機會
* 目標不只本論文的研究目標,也包括作者的長期目標
* 長期目標(Goal)呼應第一段的大問題(Problem)
* 當前目標(Answer)呼應第一段的研究空白或問題(Question)
* 為了達成長期目標,我們必須實現某個特定目標
- 引言如搭橋
* 讓讀者走進我們的研究世界
* 橋的一端是讀者的已知
# 和讀者的知識框架建立聯繫
# 提出讀者關心的問題
# 從讀者已經接受的觀念入手
* 橋的中間逐漸加入讀者未知的文獻資料
# 說服讀者某個問題值得研究,我們和讀者應該知道他們的答案
範例:問題 X 的重要性已經被學術界廣泛認可,研究者 A 發現 a1 研究者 B 發現 b1,基於上述理由回答問題 c1 對解決問題 X 至關重要
全文連結如何寫好一篇論文(01) - 論文的三段式結構
- 論文其實可以拆成三段:引言段、中间段、结论段。
- 引言段和結論段用議論文方式寫作,講究邏輯性
- 中間段則是敘事文,平鋪直述把工作描述出來
- 引言段:
* 說明研究目標合理
* 整篇論文存在價值的根基
* 告訴讀者這篇文章(讀者未知)在整個領域(已知)處於什麼位置。
* 使用文獻作為證據
* 從普遍(大家普遍接受的問題或觀念)到特定(我們的研究目標)
* 也能指導結論段
- 結論段:
* 說明研究結果價值
* 告訴讀者這個研究結果是有價值的
* 使用研究結果和文獻作為證據
* 從特定(特定的研究結果)到普遍(普遍的意義)
- 中間段:
* 即使沒有引言和結論,也能當成獨立的研究報告
* 加上引言和結論後,形成完整論文
- 如果中間段是一個「洞」,引言段讓讀者願意走到洞裡面看,結論段則是引導讀者從洞走出去