最容易分心的地方,往往也是工作入口我最近會善用 AI 工具,幫我解決很多「分心」的問題。這裡說的分心,指得是很多容易讓我迷失的資訊入口:信箱、社群、RSS 閱讀器、稍後閱讀清單等等。這些地方都是工作需要,不得不去處理:我要進信箱,是因為「可能有」讀者來信、課程邀約、合作討論、出版社溝通、臨時交辦。我要看社群,因為上面「可能有」我寫文章、作課程需要的工具更新、使用者案例、值得收錄的觀點。我要打開 RSS 閱讀器,是因為「可能有」新文章、新研究、新產品變化,支撐後續文章與課程內容。問題是,只要我自己直接進到這些入口,就很容易被次要訊息帶走。而且「可能有」就代表「不一定有」,但非常有可能我打開這些資訊入口後,反而被那些其實不需要馬上處理的資訊浪費掉最多時間。打開信箱,本來只是想找一封需要回覆的信,結果看到幾封促銷、通知、抄送、平台提醒,腦袋開始切換。打開社群,本來只是想看某個 AI 工具的新案例,結果不知不覺滑了二十分鐘(以上)。打開 RSS,本來只是想找今天值得深入讀的幾篇文章,結果先花掉一大段時間篩選、略讀、判斷、標記。我後來把這類狀況看成「外部劫持型分心」。我想專心工作,只是這些入口本來就會不斷把新刺激推到我面前。只要我一進去,就要花額外心力抵抗很多其實不需要現在處理的東西。所以我最近開始實驗一個做法:我「不要進入」信箱、社群、RSS ,先讓 AI Agent 幫我做第一輪過濾,然後我專注看真正需要處理的那封信、那則貼文、那篇文章。AI Agent 在這裡扮演的角色,就像一個站在門口的整理員。它先進到那些很吵的地方,把可能重要的東西挑出來,附上原因、來源與下一步。然後我先讀整理後的短清單。判斷出真正需要處理的回應、資料,才進入那一則訊息,專注處理。下面用三個我最近最有感的流程來說明。案例一:每天三個時段,讓 AI 先幫我篩郵件我現在處理郵件時,會把「進信箱」這件事先交給AI。不再一有空就打開信箱掃一輪,而是固定三個時段:早上開始工作前中午休息前下班前在這三個時間點,我會請 AI 先根據它目前知道的工作情況,幫我找出真正需要處理的郵件。但是這裡有一個前提:我不會在自己也不知道重點的情況下,叫 AI 從整個信箱裡幫我判斷輕重緩急。我會先給它一些判斷依據(通常就是依靠最近幾周的ChatGPT對話記憶便非常有效),例如:這一週我正在推進哪些課程、文章、合作或家庭安排。哪些對象的來信通常需要優先看。哪些主題可能跟近期工作成果直接相關。哪些郵件只要摘要即可,暫時不需要回覆。哪些類型的信不能讓 AI 自己承諾,只能先寫草稿。延伸參考:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好接著我希望 AI 輸出的是一份很短的處理清單。例如:今天必須處理的 3 到 5 封信。每封信為什麼值得現在看。建議下一步是回覆、排程、轉交、補資料,還是先延後。如果需要回覆,先擬一封草稿。附上原始郵件連結,讓我可以直接點進去確認。也附上其他AI判斷不需要處理的清單,讓我快速確認一次(但是通常都判斷正確)我慣用的指令:請根據你對我目前工作狀態、課程、專案任務與生活計畫的了解,檢查我的 @Gmail 主要收件匣中最近尚未處理的郵件。請一步一步分析,先過濾出不需要回答的資訊、電子報與通知,再挑出真正需要我回應、確認時間、安排任務,或跟我目前重要工作有關的郵件。對每一封需要行動的郵件,請提供重點摘要、建議下一步行動、是否需要放進行事曆或待辦清單,以及一版簡短有力的回覆草稿。如果需要判斷可約時間,請參考我的 @Google 行事曆 ,但最後日期仍由我確認。這樣一來,我就不用先進到整個信箱裡面,被一堆次要通知牽著走。我只要看 AI 篩出來的清單,再決定哪幾封真的要處理。我處理這個流程習慣使用 ChatGPT ,讓 ChatGPT 連結我的 Gmail 與 Google 日曆,於是透過上面指令,他會幫我判斷郵件重要性、判斷時間、建議我要加入什麼行程到日曆,並寫好回信草稿。這個過程中,我不會進入「整個信箱」,因為 ChatGPT 會提供我「需要處理的那封郵件」的連結,我只要點開那封信的連結,專心處理那封郵件即可。ChatGPT 也會給我不須回覆、可以直接封存的建議,我只要快速掃描清單,避免 AI 誤判即可,但不用點開信箱被這些郵件干擾。AI 做的是「入口整理」,提供我第一階段的判斷與草稿。這可以幫助我專注在最重要的事情上:人來決定要不要回覆、怎麼回覆、要不要接受邀約、要不要做出承諾。這個流程讓我最有感的地方,是不會遺漏一些重要的臨時交辦,但我也不需要在整個工作中反覆進信箱。案例二:用 Codex for Chrome 掃社群,但只輸出候選清單第二個分心入口,是社群。我需要看 X、Facebook 這些地方,因為有時候最新工具案例、使用者經驗、開發者分享、讀者討論,會先出現在社群上。可是社群最麻煩的地方,就是它永遠不只給我工作需要的那幾則訊息。你想看一個 AI 工具案例,下一秒就被其他留言、爭論、新聞、推薦貼文拉走。所以我最近會嘗試讓 Codex for Chrome 做一種「社群雷達」。做法很單純:我讓 Codex 進到我已登入的 X 或 Facebook,根據我近期的文章草稿、永久筆記、課程主題,了解我近期關注重點,據此去掃描今天可能值得我看的貼文。(具體操作可參考:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群) 要讓 Codex 操作我的瀏覽器或電腦時,我會把安全禁止事項「事先」寫清楚(先跟AI溝通):只掃描與摘要重點,不幫我按讚。只列候選,不留言。只提供原始連結,不自動收錄到正式資料庫。如果遇到需要登入後操作或不確定內容,先標記,等我決定。我希望它最後給我的清單不要太長,最好像上圖這樣:貼文主題為什麼值得看可能對應到我筆記資料庫中哪些主題原始網址這樣做之後,我看社群的方式有一個很明顯的差異。以前我自己打開社群,是從首頁時間線開始,每次一滑就要花掉很多時間。現在我則習慣只看 AI 整理出來的候選清單。如果清單裡真的有值得看的,我再點進去;如果沒有,我就不需要打開那個會讓我一路滑下去的介面。案例三:讓 Codex 先讀 RSS 閱讀器,再由我挑文章第三個例子,是 RSS 閱讀器。(延伸閱讀:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得)我之前曾經用 AI 做出一個 RSS 閱讀器,裡面有我訂閱的數十個文章來源。這個工具本身對我很有用。但如果每天都由我自己打開 RSS 閱讀器,再一篇一篇掃標題、判斷、摘要、標記,時間還是會被吃掉。雖然 RSS 閱讀器看起來比較不像社群一樣無關資訊太多,但其實也是另一種資訊流。每一篇都好像有一點值得看,每一篇都好像可以先打開一下。可是最後值得深入讀的可能只有幾篇,而前面篩選就已經消耗很多注意力。所以我現在做的是:讓 Codex 直接讀我的 RSS 閱讀器或訂閱來源。Codex 每天先依照我最近的筆記、文章草稿與永久筆記主題,了解我近期感興趣內容,接著進去我的 RSS 閱讀器抓出我可能感興趣的新內容,並且先放到暫存區。我希望它完成三件事:把候選文章依主題分類。每篇做一段短摘要,說明為什麼被挑出來。產出 review summary,讓我決定哪些值得正式收閱讀。它先整理成候選,保留來源、摘要、理由。等我看過 review summary,再決定哪些要抓全文、哪些要變成筆記卡、哪些可以當作文章素材。這樣做的好處是,我還是能追蹤新資訊,但不用自己先在 RSS 裡面過濾一輪。我把精力留給後面的判斷:哪些真的值得讀?哪些可以補進永久筆記?哪些只是看起來新,其實跟我現在的任務無關?三個案例背後,其實是同一個流程信箱、社群、RSS 看起來是不同工具。但我後來發現,它們可以用同一個 AI 工作流程來處理:第一步,先不要叫 AI 去看全部資訊,而是讓 AI 先了解我的需求我會先提供目前重點,例如這週正在準備哪堂課、哪篇文章、哪個專案、哪幾類合作或家庭安排。第二步,讓 AI 進入容易分心的入口,人不要進去信箱、社群、RSS 都可以,總之就是我們之前為了獲得關鍵資訊,需要花很多時間過濾雜訊(但又會被雜訊吸引的地方)。第三步,要求 AI 找出重點,輸出短清單,我自己不要進入分心之地引導 AI 有效分類統整,不要讓 AI 把所有資訊都處理,因為如果給我 30 封信、50 則貼文、100 篇 RSS 摘要,那其實只是把原本的資訊大海換成另一片資訊大海。第四步,每個候選都要保留來源連結如果沒有連結、沒有原始信件、沒有來源說明,我就不能快速回查,也不能放心引用。第五步,所有外部動作都要等我人工確認。寄信、回覆、按讚、留言、發布、正式收錄、刪除資料,都不應該由 AI 自己完成。最後一步,每次篩選準或不準都做修正,持續寫回規則,讓這個 AI 過濾機制愈來愈有效。(養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)如果它挑太多次要訊息,我就補一條排除規則。如果它漏掉某類重要信件,我就補一條優先規則。這樣下次才會更接近我真正需要的入口。結論:把人的注意力留給判斷,讓 AI 擋在資訊入口善用 AI Agent 不一定是做出多驚人的成果。讓 AI 幫我少掉一段本來很容易被分心拖走的操作,也是提升效率的做法。人少一點進信箱翻找。人少一點打開社群後一路滑下去。人少一點在 RSS 裡面一篇一篇做初步判斷。讓 AI 擋掉那些雜訊,我再決定下一步。這樣我還是有抓到重要任務、獲取關鍵資訊,也沒有放棄判斷。只是我不再每次都跳進最吵的地方,然後增加更多分心時間。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群)
電腦玩物 · 2026-05-31 15:30
上個禮拜撰寫了「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」一文,分享新手如何快速掌握 OpenAI 的 AI Agent 軟體:「 Codex 」。因為這幾個月的使用經驗,讓我認為 Codex 已經不只是一個程式開發 AI 工具, Codex 更可以當作一般人管理電腦文件檔案,甚至規劃自動化處理日常工作流程的 AI 助理。在前面那篇文章中,有提到 Codex 內有一個外掛(技能)功能,簡單的說,我安裝了一個 Google Drive 外掛,裡面包含了各種 AI 如何處理 Google 文件、試算表、簡報的技能,所以我可以直接命令 Codex 去管理我的某一個 Google 雲端硬碟內的資料,直接編輯試算表與簡報。而前兩天, OpenAI 推出了一個非常強大的外掛:「 Codex for Chrome 」,顧名思義,可以讓 AI 直接打開我電腦內的 Google Chrome 瀏覽器,幫我完成「那些原本在瀏覽器內我會自己操作的功能」,例如,下面文章中我實際測試成功的應用案例:讓 Codex for Chrome 打開我已經登入的社群網站,直接爬梳並抓取今天我可能需要的訊息。讓 Codex for Chrome 抓取景點網頁資料、整理成 Google 試算表、操作 Google 地圖建立行程清單。讓 Codex for Chrome 打開 Evernote 網頁端,直接在裡面搜尋、連結、整理與建立筆記。讓 Codex for Chrome 打開 ChatGPT 深入研究,把研究結果輸入 Gemini ,開啟 Gemini Canvas 做成網頁預覽。讓 Codex for Chrome 剪貼我在 Evernote 的文章草稿,貼上部落格後台並做好圖文排版編輯。原本的 ChatGPT、 Codex 就內建搜尋網路資料的功能,原本的 Codex 也內建打開網頁並操作的功能(例如我之前用 Codex 做一個線上象棋遊戲, Codex 可以打開遊戲網頁操作測試功能)。那麼 Codex for Chrome 最大的不同在哪裡呢?根據我實際使用後體驗到的關鍵差別是:因為直接使用我在電腦中登入的真實 Chrome 瀏覽器,所以可以處理「需要登入」(而我已經登入)的網站功能,像是各種社群、雲端服務等等。Codex for Chrome 會在我們電腦中的瀏覽器真的打開分頁操作,但會利用 Chrome 的群組分頁功能, AI 的操作在「背景分頁」自動處理,我們可以看,但不影響我們同時操作其他分頁。(延伸閱讀:我用 Chrome 內建分頁群組,解決多線 AI 助理與工作流程混亂的問題)透過 Codex for Chrome,我們可以利用 AI 去處理一系列雲端服務網站的操作,可以在網站中使用功能、輸入資料、獲取內容,並且可以串聯多個步驟(例如要求 AI 連續打開多種網站,自動完成一系列前後接續的操作),成為一個對一般人來說最簡單的自動化工具(因為執行過程完全只需自然語言下指令,不會涉及任何程式碼)。延伸教學:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好延伸教學:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得如何開始使用 Codex for Chrome:首先,你當然需要先下載安裝 OpenAI 的 Codex 軟體(參考:「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」)。接著,在左上方的「外掛程式」頁面,找到最新推出的「 Chrome 」外掛,直接選擇安裝即可。同時,還需要在 Google Chrome 瀏覽器中,安裝「 Codex 」的應用程式(外掛頁面會引導你去安裝)。兩者都做好,就能讓 Codex 去操作 Chrome 瀏覽器中的網站與功能。最後,最簡單的使用方式,就是我們可以在 Codex 中利用左下方的「(單純)聊天」功能,開一個新的對話,在對話一開頭先輸入「 @chrome 」,主動呼叫出 Chrome 外掛,就能開始下指令,要求 Codex 去做各種瀏覽器端的網站操作了!讓 Codex for Chrome 打開我已經登入的社群網站,直接爬梳並抓取今天我可能需要的訊息:每天要獲取大量資訊,還要整理資料庫,是非常繁瑣的動作,所以我會交給 AI :「AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得」。要讓 Codex AI 去抓取網頁資料,甚至 YouTube 影片字幕,都很簡單。但是,如果要讓 AI 直接「像我一樣」捲動瀏覽我的社群首頁,幫我看過一遍,然後抓取我可能需要的貼文資訊呢?這時候就可以利用 Codex for Chrome,我是這樣下指令的(指令中所說的資料庫,就是我前面文章所說的,利用 AI 建立的外部資料庫):@chrome 檢索我的 X 社群貼文,根據我資料庫中的筆記、寫作喜好,過濾出我感興趣的貼文,請一步一步分析,檢索貼文,遇到我感興趣的主題就摘要,持續進行直到瀏覽完今日社群主要貼文為止,然後把摘要的貼文與網址列成清單讓我瀏覽。我要求 Codex 做幾個連續動作:打開我已經登入的社群網站。捲動我的首頁。一頁一頁捲動,從中找出我感興趣的主題貼文。抓出貼文的摘要與網址。列成清單。而當 Codex for Chrome 實際操作時,就會像下圖這樣, AI 會在我真正使用的瀏覽器中,打開一個背景分頁群組,然後在背景自己操作我的社群去瀏覽。那個當下,我則打開其他分頁在做其他工作。下面則是 Codex 在訊息中呈現他做了哪些動作,可以看到 AI 根據我資料庫中的主題,一頁一頁過濾我的社群貼文時間線的訊息。最後的結果如下,正確的根據我的喜好與要求,列出他找到的貼文摘要、連結清單。平常我自己爬社群訊息,是最花時間又低效益的一件事情,而現在可以交給 Codex for Chrome 來說,他自己爬梳完十幾頁內容後,自然我給我關鍵資訊摘要。讓 Codex for Chrome 抓取景點網頁資料、整理成試算表、操作 Google 地圖建立行程清單:接下來,我又做了一個挑戰。為了準備今年暑假的一次家庭旅行,我讓 Codex for Chrome 打開我的瀏覽器,幫我完成下面一系列操作:@Chrome 請幫我搜尋峇里島最近適合親子遊的景點,結合台灣部落格的真實心得資訊,先在我的 Google 雲端硬碟建立一份 Google試算表,最後在 Google 地圖建立「2026峇里島之旅」旅遊清單,請一步一步分析,要求:1. 至少瀏覽 10 篇真實心得或討論2. 排除官方宣傳頁3. 優先找親子、家庭的案例4. 整理成 Google 試算表表格: - 地點名稱 - 地址 - 適合優點 - 注意事項 - 來源連結5. 接著根據試算表資料,上 Google 地圖搜尋地點,儲存到你建立的清單,地點附註加上前面整理的優點與注意事項。一樣在單純的 Codex 聊天中就可以完成,連專案都不用建立。(這對一般人最好上手!)這個案例中,其實 Codex 不只使用了 Codex for Chrome 的外掛, AI 會根據最適合的方式,自動調用不同外掛:搜尋部落格網路資料摘要,這個用內建搜尋瀏覽器功能即可。要把資料整理成 Google 試算表, Codex 調用的是 Google 試算表的技能。最後要把資料新增到 Google 地圖、建立旅遊清單,才使用 Codex for Chrome 來操作。完成後,Codex 會把產出的 Google 試算表、 Google 地圖清單連結,附在聊天訊息中。我們來看看 Codex 整理出來的結果,把 15 篇網頁文章,整理成 10 個推薦景點,也都根據我的指示,摘要出地址、優點、注意事項等等,一份很完整正確的 Google 試算表。打開 AI 建立的 Google 地圖旅遊清單,每個地點正確標示,在清單中把試算表內容填入,完全不用我自己手動操作就完美完成!讓 Codex for Chrome 打開 Evernote 網頁端,直接在裡面搜尋、連結、整理與建立筆記:我自己目前主要的「防彈筆記」(專案流程、任務經驗)還是使用 Evernote 。那麼, Codex for Chrome 可不可以直接操作 Evernote 呢?我是這樣下指令的:@chrome 打開我的 Evernote 網頁(https://www.evernote.com/client/web), 建立一則 Codex 主題筆記,內容是相關資料連結,請一步一步處理:1.先建立一則全新的 Codex 主題筆記。2 在 Evernote 內搜尋 codex 關鍵字找出標題有相關關鍵字的筆記,每一則筆記都建立一個連結,連到前面的主題筆記。3. 在我的這個 RRS-brain 資料庫中,找到 Codex 相關的永久筆記,也補充到前面的 Codex 主題筆記 Evernote 中。這個流程中,一開始我沒有成功,第二次我直接告訴 AI 打開 Evernote 筆記頁面的網址,就成功了。其實,我原本不確定 Codex for Chrome 會不會「操作」 Evernote 上的搜尋、連結、編輯筆記等等功能,但最後結果可以說是「完美」完成。下圖就是 Codex for Chrome 正在操作 Evernote 網站時,我打開背景分頁「偷看」 AI 在幹嘛?正好看到他自己輸入關鍵字,在我的 Evernote 中搜尋筆記。我只要說明操作步驟,看起來 Codex for Chrome 可自行掌握各種網站的功能。這樣我的 Codex 本地端資料庫,就跟雲端的 Evernote 完整結合在一起了!下面是 Codex 自己在我的 Evernote 網頁端完成的筆記,格式正確、資料正確,且善用 Evernote 內建的功能(例如連結,也都是正確的)。(附註:不過現在的 Evernote 內建 AI ,其實也可以完成類似自動編輯處理)讓 Codex for Chrome 打開 ChatGPT 研究,把研究結果輸入 Gemini 做成網頁預覽:接下來,我想利用 Codex for Chrome 來幫我「操作多個 AI 服務」,並且串聯不同 AI 服務產出的內容,最後輸出我要的結果。下面是我的指令:@chrome 你是小孩遊戲化學習的設計助理,幫我設計出一個可以讓小孩練習的國小三年級自然科練習網頁。請一步一步設計: 1.打開我的 ChatGPT 網頁( https://chatgpt.com/ ),開一個新的聊天串,使用 Thinking 以上模型,利用搜尋功能,梳理出國小三年級自然課關於「物質三態變化」的相關課文、教案、練習題目,你可以多次來回問答,根據回答修正提問,直到找出最完整適合小孩學習的教材內容,並整理成一份練習清單。2.接著打開我的 Gemini 網頁( https://gemini.google.com/app ),先研究如果要設計一個課堂中可以用,讓小孩打開網頁就能練習的互動遊戲化測驗,有哪些案例,可以怎麼設計,整理成一份設計規則清單。 3.當前面兩個步驟完成,最後利用 Gemini 再開一個新的聊天室,啟動 Canvas 功能,寫出指令,把前面的遊戲網頁設計規則+自然課練習清單輸入,利用 Gemini 做出可預覽使用的網頁,做出模擬線上測驗遊戲,下圖是 Codex 自己打開網頁進行的操作,他打開我登入的 ChatGPT ,切換到 Thinking 模型,自己寫出一段符合我要求的指令,然後開始研究。ChatGPT 思考模型有時候要想比較久,這時候 Codex for Chrome 幫我「自動監控」 ChatGPT 到底回答好了沒?我不用在旁邊等 AI 做好,而是接給 Codex 全面接管。ChatGPT 研究完, Codex 接著自動打開 Gemini 網站,開始根據我的要求,研究怎麼設計遊戲化學習網頁。ChatGPT、Gemini 研究完後,Codex 又準確的根據我的指令要求, AI 再開一個 Gemini Canvas 對話串, 把前面 ChatGPT 研究的練習清單、 Gemini 研究的設計方案,交給 Gemini Canvas 執行設計網頁流程。透過這個流程, Codex for Chrome 幫我同時操控三種 AI 工作流程,自動接續,最後完成我要的練習網頁。下圖是最後 Gemini Canvas 輸出的結果。讓 Codex for Chrome 把 Evernote 中寫好的文章貼上 Blogger ,並完成編輯體例調整我自己寫部落格文章時,喜歡先寫在 Evernote 筆記中,完成後才貼上 Blogger 後台去做調整。所以我下了這樣的指令,挑戰看看 Codex for Chrome 可以自動完成到什麼程度:@chrome 請幫我把下面文章內容,上架到我的 Blogger 。請一步一步處理:1.先打開我的 Blooger( https://www.blogger.com/home ),建立一篇新文章,題目是「Codex for Chrome 自動化工作流程教學,讓 AI 操作 Gemini、 Evernote、 Google 地圖、爬社群貼文」,不要發布。2.打開我的 Evernote(https://www.evernote.com/client/web),抓取「當 Codex 擁有控制 Chrome 的能力]這則筆記的內容當作文章內容,但只要抓取「文章草稿:(中標題)」層級下的內容,不要抓最下面的封存資料。2.使用 Blogger 編輯介面的相應功能,處理下面文章,調整格式、清理不必要程式碼,內容則原封不動,包還其中的連結、圖片、粗體、樣式層級都要保留,但改成網頁閱讀更舒適的版面編排,只要完成編輯,可順利預覽即可。3.不要發布,讓我確認。結果 Codex 可以順利打開我的 Blogger ,建立新文章,開始編輯。也能正確打開 Evernote 的對應筆記,準確的複製內容。圖片也能正確貼上。透過上面的測試, Codex for Chrome 讓 AI 從「網路資料整理」進一步變成「網站操作代理」。幫我把原本要開很多分頁、登入很多服務、複製貼上很多資料的流程,變成一句自然語言指令,我只要把平常會在瀏覽器裡做的動作說清楚,Codex for Chrome 就能照著做,驅動 AI 自動化完成。也推薦你可以試試看。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群)
電腦玩物 · 2026-05-09 19:25
前兩天在電腦玩物分享了 OpenAI 的桌面端 AI 助理 Codex 教學:「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」,今天繼續分享一個一般人日常也可以使用的 Codex 應用案例:製作動畫影片,可以把一篇文章轉成教學影片,可以把一個網站轉成介紹影片。只要在 Codex 建立影片專案資料夾,利用 OpenAI 內建的影片製作外掛(包含對應的技能 Skills ),就可以透過「開口下指令」的方式,讓 AI 助理幫我們撰寫影片腳本、準備影片圖片素材、設計影片動畫特效、完成影片剪輯!像是老師要製作教學影片,專案經理要製作產品說明影片,都可以利用 Codex 建立一個更自動化的影片生產流程。透過下面分享的方法,我把前幾天的這篇教學文章「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」,在只動口下指令的情況下,沒有自己動手做任何的剪輯修改,把文章轉換成下面影片版本。第一步,讓 AI 先抓取文章,規劃影片腳本我的步驟是這樣的。先在 Codex 開一個新的聊天,然後指定一個未來要製作影片用的電腦資料夾,這樣就開始了一個影片製作專案。(詳細教學步驟可參考:「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」)然後我的第一個指令如下,先打開 Codex 的「規劃模式」,讓 Codex 去抓取指定網頁的文章、圖片,先寫出一個影片腳本。你是我的影片製作專家,把這篇文章內容「https://www.playpcesor.com/2026/05/codex-ai.html」,改寫成教學影片的腳本。請一步一步處理,根據這篇文章的教學文字內容,網頁文章中提供的教學圖片與文字,思考如何變成一則快速上手教學影片。我的期待是影片本身會用圖文搭配動畫製作教學,內容除了搭配文章中的關鍵字句、圖片外,也可以搭配一些圖解動畫方式呈現。影片不會有旁白,但有配樂。每一頁的節奏明快,讓人看得懂,但不會太沉悶,影片能引起大家的興趣,並能掌握快速上手的核心邏輯。第二步:讓 AI 自己把圖文素材準備好根據腳本計畫執行的 Codex ,不只會寫出影片的分鏡架構,還自動把我文章中的圖片都抓取下來,之後可以放入影片中。第三步:利用 Codex 內建的影片製作外掛目前 Codex 內建了兩種製作動畫影片的外掛:Remotion(製作的影片比較簡單,但是產出速度更快)HyperFrames by HeyGen(製作的影片有比較多動畫效果)直接在 Codex 的「外掛程式」頁面找到這兩個外掛,安裝其中一個即可(相應的技能等也會一起安裝)。這邊我利用 HyperFrames by HeyGen 來做示範。要特定外掛時,可以在 Codex 先輸入 @ ,然後打上外掛名稱即可。於是在完成腳本、抓好圖片素材的 Codex 專案中,我接著這樣下指令(一樣開啟「規劃」模式,先做計劃再執行):@HyperFrames by HeyGen 根據專案的教學影片腳本,以及你準備好的文字、圖片素材,製作出教學影片。請你一步一步分析我的需求,這支影片主要的目的是了解觀念、引起興趣,並且會讓看到的人願意分享。用這樣的角度去思考,在目前現有的腳本架構、圖片素材當中,你怎麼把它們重新組合來製作影片?你自己去決定影片的規格,你可以做幾輪的分析,去嘗試找到影片當中如果還需要製作一些動畫素材,或者什麼樣的串場,自己想辦法去實現它。Codex 擬出了下面計畫,我就讓他接續執行。這時候,會需要安裝製作影片需要的程式、工具,但是不用擔心,Codex 會自己在電腦資料夾中完成這些動作,我們就交給 AI 執行即可。第四步:完成影片並匯出當 Codex 完成影片後,可能出現幾種情況,如果比較短的影片,有時候 Codex + HyperFrames 會直接匯出 mp4 影片,儲存在我們前面指定給他的專案資料夾中。但如果是 Codex + HyperFrames 的搭配,製作完成後有可能先提供一個預覽網頁。我們先在網頁中查看影片效果如何,如果決定匯出,就在右上方的「 Renders 」處,選擇「 Export 」匯出成 MP4 影片檔案。第五步,讓 AI 協助幫影片加上配樂、音效如果前面製作的影片沒有配樂,我可以這樣接續的問 Codex:如果我想要加上音樂、音效甚至配音,可以怎麼做,請一步一步規劃執行。在這個測試中, Codex 找到了可以授權免費商業使用的音樂,直接加入前面的影片中。第六步,影片不如預期怎麼辦?如果想要修改影片,因為 Codex 上也無法進行影片剪輯或編輯功能,所以也都是直接下指令即可。例如我想要影片換頁的節奏快一點,我就說:根據下方需求,改進腳本,重新製作影片,請一步一步分析處理:這一個版本的單一畫面停留太久,因為我沒有要搭配旁白,希望觀看者直接從螢幕畫面上獲取需要的內容,所以你應該把關鍵解說文字也放入單一畫面,思考觀看者讀完內容的節奏,就要切換到下一個畫面。第七步:讓 ChatGPT Images 2.0 補圖Codex 本身也可以使用最新的 ChatGPT Images 2.0 生成 AI 圖片(參考:ChatGPT Images 2.0 工作專用 AI 繪圖工具:大量密集中文排版圖解、簡報案例實測),而且只要下好指令,可以「一口氣生成一系列圖片素材庫」。我一樣先用「規劃」模式, 讓 Codex 思考應該補上哪些圖片素材,先做好計畫:接下來這段影片當中應該會需要一些圖片素材,幫我規劃要設計哪些圖片,然後用你的生成圖片能力把這些圖片素材生成出來。請你一步步分析,根據前面的這個腳本,裡面已經有一些固定的教學截圖,但如果再加上怎麼樣的圖解、怎麼樣的流程圖,或者怎麼樣的 icon、圖像,這個影片會更有趣呢?先幫我做好規劃,然後接下來一步步生成這些需要的圖片素材,作為接下來要製作影片所使用。做好計畫後,讓 Codex 用自己的 AI 繪圖能力開始生成一系列圖片。最後讓 Codex 把前面新生成的圖片,加入到影片中即可。Codex 對一般人來說,不一定要寫程式,也可以完成各種日常工作,例如這篇教學文章中分享的「製作影片」案例。我們只要下指令,就可以讓 Codex 透過內建的外掛,自動完成撰寫腳本、準備素材、繪製圖片、製作動畫、剪輯影片的一系列工作流程。大家手上其實都有很多「已經寫好的內容」:教學文章 課程講義 公司內部 SOP 產品說明文件 部落格文章 專案介紹頁未來文章、簡報、文件都可以交給 Codex AI Agent 轉成影片版本。有興趣的朋友可以試試看。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:不用打開剪輯軟體,用 Codex AI 把一篇文章自動做成圖文動畫教學影片)
電腦玩物 · 2026-05-05 21:24
前兩天在電腦玩物分享了 OpenAI 的桌面端 AI 助理 Codex 教學:「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」,今天繼續分享一個一般人日常也可以使用的 Codex 應用案例:製作動畫影片,可以把一篇文章轉成教學影片,可以把一個網站轉成介紹影片。
只要在 Codex 建立影片專案資料夾,利用 OpenAI 內建的影片製作外掛(包含對應的技能 Skills ),就可以透過「開口下指令」的方式,讓 AI 助理幫我們撰寫影片腳本、準備影片圖片素材、設計影片動畫特效、完成影片剪輯!像是老師要製作教學影片,專案經理要製作產品說明影片,都可以利用 Codex 建立一個更自動化的影片生產流程。透過下面分享的方法,我把前幾天的這篇教學文章「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」,在只動口下指令的情況下,沒有自己動手做任何的剪輯修改,把文章轉換成下面影片版本。第一步,讓 AI 先抓取文章,規劃影片腳本我的步驟是這樣的。先在 Codex 開一個新的聊天,然後指定一個未來要製作影片用的電腦資料夾,這樣就開始了一個影片製作專案。(詳細教學步驟可參考:「一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程」)一般人也能快速上手的 AI Agent:Codex 電腦端軟體今天這篇文章想分享的是:如果我們不是懂程式設計的工程師,一般人要怎麼快速上手 OpenAI (ChatGPT) 的 Codex 工具?如何用這個 AI 助理,協助我們處理電腦硬碟資料夾中的工作文件、任務成果,進一步打造一個更自動化的電腦工作流程。我覺得接下來想要善用 AI 的工作者,除了擁有像 ChatGPT 這樣的對話型生成式 AI 之外,也應該開始擁有一個像 Codex 這樣可以操作電腦、處理電腦中資料與文件的 AI 助理。兩者搭配在一起,可以建立一套更完整的人與 AI 協作流程。延伸教學:不用打開剪輯軟體,用 Codex AI 把一篇文章自動做成圖文動畫教學影片延伸教學:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群延伸教學:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好延伸教學:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得以我目前使用 ChatGPT 和 Codex 的經驗來看,兩者的分工有明顯不同。一個任務通常會有最後要輸出的成果,例如一份文件、一份簡報、一張試算表,或是一個整理完成的資料庫。但在真正進入「產出」之前,往往還會有一段很重要的前置流程:研究、發想、企劃、分析與復盤。所以在大方向上,我會這樣分工:ChatGPT:處理研究、發想、企劃、分析與復盤。我會利用 ChatGPT 上已經訓練好的專案助理,搭配 Deep Research 這類搜尋研究功能,透過對話進行腦力激盪、資料分析、計畫設計與任務規劃。 Codex 桌面端:處理真正要完成的工作成果。當我要根據前面規劃好的工作流程,實際產出一份文件、一份簡報,或是處理各種試算表、數據資料,整理電腦資料夾中的工作文件,乃至於真的要製作一個網頁、一個工具時(例如個人理財工具、產品說明網頁),就可以善用電腦端的 Codex 來完成。 可以參考這個有趣例子,就是 ChatGPT 到 Codex 互相搭配完成的:不同 AI 工具如何分工、接力完成專案,分享我做一個象棋教學遊戲的流程在 Codex 這樣的 AI Agent 可以編輯、管理電腦中資料文件的情況下,很多「輸出工作成果的流程」,我已經逐步轉移到 Codex 上進行。甚至像 Google 雲端硬碟中的文件,也可以交給 Codex 進一步編輯與處理。對一般使用者來說,OpenAI 推出的 Codex 桌面端軟體,現在已經不需要任何程式開發基礎。只要安裝完成,就可以開始使用。操作過程也不一定需要接觸任何程式碼相關技巧。所以這篇文章,我想從「非工程師、一般工作者」的角度,分享如何快速上手 Codex 桌面端軟體,以及可以嘗試看看的應用案例。一般人如何立即了解 Codex ?把電腦資料夾變成 AI 工作台很多人聽到 Codex,第一個反應可能是:這不是寫程式的人才會用的工具嗎?如果你不是工程師、不想寫程式,也沒有要開發軟體,好像就跟自己無關。但我這幾個月實際用下來,覺得這是一個一般人也能快速上手的 AI 工具:Codex 對一般人的真正應用,不是寫程式,而是把一個本機資料夾,變成可以被 AI 處理的工作台。經過持續的改進與發展後,Codex 已經慢慢不只是寫程式的人才會用到的工具。基本上,你在電腦中需要操作的各種文件、檔案、資料整理與成果產出,也都可以納入 Codex 的 AI 工作流程中。你只要下載 Codex 軟體,授權 Codex 管理你電腦中的某一個資料夾,它就可以開始協助你完成很多原本要自己慢慢處理的任務,例如:資料夾裡有一堆文件,不知道怎麼整理,可以請 AI 幫你分類與管理。 裡面有一堆數據試算表,可以請 AI 協助統整、分析,甚至直接調整 Excel 上面的欄位與數據。 有一堆文件、PDF、筆記,可以請 AI 重新整理,轉換成一份圖文並茂的簡報。 如果你使用 Google 雲端硬碟和電腦同步,Codex 也可以直接處理 Google 文件、Google 試算表、Google 簡報等內容。 更進一步,你也可以把 Codex 當成資訊整理與筆記管理工具,在你的電腦硬碟資料夾中建立個人資料庫。 (延伸教學:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得)以前這些事情,我們可能會打開檔案總管、筆記軟體、雲端硬碟、試算表、簡報軟體,自己慢慢操作。但現在如果有一個 AI Agent,可以直接在你指定的資料夾裡讀檔案、整理內容、建立新文件、修改草稿、產出清單,甚至把做得好的流程寫成下一次可以重複使用的規則,那麼 Codex 對一般人的價值,就不只是「幫工程師寫程式」。而是:幫一般人把日常工作中最耗時的資料整理、文件處理、分析準備與成果產出,變成一條可以讓訓練好的 AI 助理去完成的自動化工作流程。這些工作流程,如果只用傳統的 ChatGPT 對話來完成,可能會遇到幾個限制:ChatGPT 不一定能直接處理你電腦硬碟資料夾中的所有內容。 它比較不像真正的桌面軟體,可以直接編輯與管理檔案。 當任務需要長時間、多步驟、連續處理一整批資料時,單純的對話式 AI 比較容易中斷或失去脈絡。 但 Codex 的桌面端軟體,就是一個可以在電腦端工作的 AI 助理,可以自己完成上述步驟。更重要的是,對一般使用者來說,現在使用 Codex 桌面端軟體,不需要碰到讓人頭痛的程式碼或終端機介面。它的介面已經很成熟,比較接近一般知識工作者可以理解的「任務+對話+成果」三欄工作台。你可以這樣理解 Codex 的 Windows 桌面端 App:最左邊的對話討論串:可以想像成你一個一個要管理的專案,或是不同電腦資料夾中的工作任務。中間的對話欄位:就是你交派 AI 助理工作的地方,可以請它在專案資料夾中完成各種步驟與任務。最右邊的預覽區:可以查看 AI 幫你完成的成果。除了程式碼,也可以預覽 Markdown 文件、Word、Excel、PowerPoint 檔案,甚至還有一個小型瀏覽器,可以直接瀏覽網頁內容。 所以 Codex 不只是「寫程式 App」,也不是單純另一個對話式 ChatGPT。對一般工作者來說,它更像是在同一個專案資料夾中,從文件整理、資料研究、內容分析、簡報草稿、試算表整理,一路延伸到小工具開發的 AI 工作助理。我的第一個 Codex App 應用案例,和程式開發完全無關:我對 Codex 這樣的 AI 助理工具,第一次覺得它很貼近一般人日常工作需求,是今年年初的一個旅行整理案例。當時我們有兩個家庭要一起去新加坡旅行。因為人數比較多,我們買了非常多景點、遊樂園的票券,也有交通票券、住宿資料等各種文件。一時之間,所有資料混在一起,變得很難統整。於是我把這 40 多張雜亂的票券,全部放進電腦硬碟中的同一個資料夾,接著請 Codex AI 助理幫我處理(操作介面如上圖)。第一步,我先請 AI 幫我分類。結果 AI 很聰明地根據每一張票券上的日期,把原本雜亂的票券重新分類在一起,建立出更有邏輯的資料夾整理方式。第二步,我讓 AI 從亂七八糟的票券整理出正確行程。接下來,我再請 AI 從這些已經分類好的資料夾中,梳理出我們完整的旅行行程。AI 也能有效從這些票券內容裡抓出關鍵資訊,整理成一份行程清單。整個過程大概兩三分鐘內就完成了。以前這樣的工作,如果是我自己來做,我需要在 40 多張雜亂票券中,一張一張檢查日期、景點、時間與地點,先建立分類資料夾,再擷取每張票券中的關鍵資訊,最後整理出一份行程表。這樣的工作,起碼也要花 30 分鐘甚至 1 個小時以上。但交給 AI 助理後,它可以在很短時間內完成。而且這個過程中,AI 需要讀取 PDF、需要辨識票券中的文字,亦或是需要 OCR,這些原本聽起來可能比較麻煩的技術細節,AI 助理會自己判斷怎麼處理,甚至自己寫小程式來解決。對一般使用者來說,我們不一定需要知道它背後怎麼處理 PDF、怎麼做 OCR、怎麼寫程式。只要清楚傳達需求:這個資料夾裡有一堆旅行票券; 請你先根據日期、類型幫我分類; 再從票券中整理出完整行程表。 Codex AI 就能在電腦資料夾裡,自動幫我們完成這些原本要手動慢慢整理的工作。這也是我第一次很明確感受到:Codex 這類 AI Agent,對一般人來說,並不只是拿來寫程式,而是可以幫我們處理那些「在電腦裡很瑣碎、很重複、但又必須完成」的工作流程。一般人上手 Codex 的第一步:不要先想「自動化」,先建「專案資料夾」如果你之前完全沒有使用過 Codex,也沒有程式開發的基礎,那麼上手 Codex 的第一步,不是急著讓它幫你自動化,也不是一開始就要求它完成很複雜的任務。我會建議先做一個很簡單、也相對安全的動作:在電腦硬碟中建立一個新的專案資料夾,讓 Codex 在這個指定專案資料夾中測試處理資料。Codex 對一般人是一個可以連到本機資料夾的行動型 AI 工作台。你可以把它想像成:先建立一個 thread(討論串),像是在 ChatGPT 裡開一個對話;但不同的是,這個 project 可以連到你電腦上的某個資料夾,讓 Codex 在指定範圍內讀取、整理、建立或修改檔案。所以,對非程式工作者來說,我們可以從整理筆記、清理資料、比較草稿、處理文件開始,而不是從程式碼開始。為了安全起見,我會建議先用「複製副本」的方式,把原本專案中的雜亂文件複製到這個新的資料夾中。例如你可以建立這樣的資料夾:[副本] 旅遊規劃_東京親子行航班時間 飯店資訊 想去的景點 預算限制 家人偏好 已經查到的餐廳或交通資料[副本] 理財月報_2026收支表 投資紀錄 上個月回顧 目前目標 自己的判斷原則[副本] 課程講義文件[副本] 網站文章草稿[副本] 客戶訪談資料分析你不需要一開始就做任何分類,也不用先整理得很漂亮。這個資料夾可以很雜亂,因為最後可以讓 AI 幫你整理。也因為它是一個副本專案資料夾,所以即使 AI 助理在調整、分析或測試過程中出錯,也不會影響到你原本正式的專案內容。這對第一次使用 Codex 的一般工作者來說,是比較安心的開始方式。如果你的 Google 雲端硬碟有同步到電腦本機,也可以用類似的方式,建立一個同步資料夾,讓 Codex 處理其中的 Google 文件、Google 試算表、Google 簡報或其他相關檔案。接著,可以讓 Codex 先做一個動作:請 Codex 先看一下這個專案資料夾裡面的文件內容,告訴你它看到了什麼。一開始不要直接叫它修改、刪除、重命名或搬移檔案。先請它盤點,理解這個資料夾的內容,並且提出建議。你可以明確告訴它:先不要修改任何資料,只要回報它的觀察,等你確認後再開始執行。可以使用這樣的提示詞:請先檢查目前這個資料夾。請回報:1. 你看到了哪些檔案?2. 這些檔案可能分別代表什麼?3. 這個資料夾適合先做哪 3 個小任務?4. 其中哪一個任務最安全、最容易驗收?先不要修改任何檔案。請等我確認後再執行。這段提示詞看起來不華麗,但它幫我們建立了三個護欄:先盤點,不先動手。先建議小任務,不直接做大改。先等人確認,不擅自修改。 透過這樣的方式,你就開始了用 Codex 管理專案資料夾的第一步。下面是我建立了一個孩子課業學習資料的資料夾後,讓 Codex 盤點一下可以做什麼遊戲化工具。而最後根據 Codex 的建議,讓 Codex 自己建立遊戲機制、自己畫圖(支援用 GPT Images 2.0 畫遊戲圖像素材),大概週末半天的討論時間,完成下面這個成果。要正式交派任務前,先讓 Codex 建立基礎專案規則文件:前面建立專案資料夾、讓 Codex 先盤點內容,只是一個簡單的上手練習。當我們真的要開始處理比較複雜的任務時,就可以在中間的對話視窗,開始對 AI 交派任務。但是,在正式交派任務之前,有一個很關鍵的第一步:當 AI 助理已經理解這個專案資料夾中的基本內容後,先給它一個目標,請它建立一份基本的專案 MD 文件。可以利用像是下面這樣簡單的指令:根據前面的理解,建立專案規則文件,讓未來的工作可以遵循。Codex 通常會建立一份 Agents.md 文件,這份 MD 文件可以用來記錄:這個專案的目標是什麼。 AI 目前如何理解資料夾中的內容。 這個專案接下來可能要完成哪些任務。 未來處理這類任務時,應該遵守哪些基本原則。 之後隨著專案任務持續推進,這份 MD 規則文件甚至可以再衍生出不同子任務的規則文件,並且在工作過程中持續復盤與更新。這樣做的目的,是讓接下來的 AI 助理有共同的遵循原則,也能保留更長期的記憶。甚至當我開一個新的討論串,或是重新進入這個資料夾時,Codex 也可以透過這些文件記得前面的狀態,立刻接手工作。例如我有一個理財的 AI 助理,我就先建立一個理財專用的資料夾,把目前某些財務、投資現況的試算表先丟進去。接著,我會用前面的方法,先讓 AI 助理理解這個專案資料夾裡的文件資料,並且請它建議:如果以家庭理財為目標,接下來可以先做什麼任務。這時候它可能會建議我,先建立一個可以減少手動更新,並且以 10 年、20 年長期目標為主的理財規劃工具,或者理財規劃頁面。於是我就會請 AI 助理,把這個目標,以及它目前對我理財現況的理解,先建立成一份基本的專案 MD 文件。這樣之後在持續推進理財規劃的過程中,AI 助理就有一個可以遵循的原則。開始對理解專案內容的 Codex 交派任務:當 Codex 已經理解專案資料夾的內容後,接下來就可以開始交派任務。當我們正式交派 AI 任務時,尤其對一般人來說,很可能不一定具體知道 AI 做不做得到我想要交付的工作。例如:我不知道它到底可以處理一份簡報到什麼程度。 我不知道它可以整理一份試算表到什麼深度。 我也不一定知道它會用什麼方法完成任務。 所以這時候最好的測試與溝通方法,不一定是教 AI 每一步怎麼做,而是在指令裡明確說明:這次任務想完成什麼成果。資料處理的界線在哪裡。 我想像中的需求是什麼。 解決之後要達到什麼效果。 我會用什麼標準來驗收。 換句話說,我們要把「成果」說清楚,把「需求」說清楚,把「驗收標準」說清楚。至於到底要怎麼做到,可以讓 Codex 自己想辦法設計工作流程。這時候我的交派任務經驗是(尤其 Codex 更新到可以使用 GPT-5.5 模型後),會在指令中明確交代幾件事:成果:最後要輸出的是一份報告、簡報、網頁、圖片,還是其他內容?請 AI 助理一步一步處理。資料範圍:AI 助理這次明確要使用哪些資料,並且提醒它要先從規則文件出發。需求與驗收標準:這個成果要解決什麼問題?滿足哪些需要?誰會怎麼使用這個成果?界線:可以做什麼,不可以做什麼。 如果任務比較複雜,我也會搭配 Codex 的 Plan 規劃模式,讓 AI 助理先自己設計工作流程,再開始正式執行。讓我們從前面那個雜亂的旅行票券資料夾出發,試試看怎麼讓 AI 助理去處理一個任務,並且輸出具體成果。在這個案例中,我利用前面建立好的指令與規則,要求 Codex 輸出一份「讓旅行同伴也能快速理解這次行程重點的圖文手冊」。這時候,我沒有一開始就告訴它到底要做成網頁版、PDF,或是哪一種格式;也沒有直接教它每一步要怎麼製作。我只先告訴它幾件事:限定要使用的資料範圍是什麼。 我希望這份圖文手冊達到什麼效果。 我希望圖文手冊的內容有哪些關鍵限制。 這份手冊是給旅行同伴快速理解行程重點使用。 接著,我開啟 Codex 的 Plan 模式。這個模式的意思,有點像是讓 AI 先根據目前的需求與資料範圍,自己思考怎麼做會比較好。這時候 Codex 不會馬上開始動手,而是先在規劃過程中詢問我幾個關鍵問題。從你對專案的理解與規則出發,製作一份讓旅行同伴也能快速理解這次行程重點的圖文手冊。請一步一步處理,以前面建立的行程表為基礎,以所有票券資料為素材,整理出來的圖文手冊要能方便分享給每一個旅伴,讓每個旅伴都能掌握每一天、每一地的必備資訊,但又有吸睛、對應真實資料的圖片、圖解作為輔助,複雜的資訊會更易懂,有趣的行程會看起來更有趣。一定要使用繁體中文說明,避免重複或瑣碎不必要的資訊堆積,要依照每一天的行程順序為順序架構。例如,它先問我:這份手冊到底要做成 PDF 版、Markdown 圖文版,還是簡報版?我可以從中選擇一個自己最想要的方式。接著,它也會問我:手冊中的圖片應該怎麼呈現?它當時提供了三個選項,但裡面沒有我真正想要的選項。這時候,我就可以自己打字補充,告訴它:我希望結合官方照片,再加上 AI 自己繪製的圖解。經過這樣的規劃後,Codex 會先提出一份「如何製作這份圖文手冊」的製作計畫,而不是立刻動手。我檢查這個計畫,如果覺得方向可行,就按下「執行此方案」的選項。接著 Codex 就會依照前面規劃好的步驟,一步一步處理。這時候就可以看到 AI 助理的威力:它可以讀取電腦硬碟資料夾中的文件內容。 它可以結合上網搜尋,補充官方資料來源。 它可以使用內建工具,甚至自己寫工具,來完成製作 PDF 所需要的各種操作。 我們不需要自己處理那些繁瑣步驟,只要讓 AI 依照計畫自動完成。 完成後,Codex 通常也會自己做一次驗證,確認它交付的成果內容是可用的。所以在 Codex 裡交派任務時,我現在會採取這樣的流程:先說清楚成果。 指定資料範圍。 說明需求與驗收標準。 補上可以做與不可以做的界線。 任務較複雜時,開啟 Plan 模式,讓 Codex 先設計工作流程。 確認計畫後,再讓它開始執行。任務完成後:先檢查成果,再請 Codex 復盤成規則當 Codex 完成我們交派的任務後,產出的成果可能是一份簡報、一份文件、一張試算表,或是其他專案檔案。這時候,它會在回答的最下方列出這次產出的檔案。我們只要按一下右邊的「開啟」,就可以在右側預覽畫面中,直接檢查剛剛完成的結果。Codex 的預覽工具不只可以看網頁、看程式碼,也可以查看我們一般工作者更常使用的文件、試算表與簡報內容。也就是說,當 AI 完成任務後,我們可以立刻在同一個介面裡確認:這份文件內容是否正確? 這份試算表整理是否符合需求? 這份簡報是否可以拿來使用? 這次成果是否達到前面設定的驗收標準? 如果我覺得這一次產出的結果是可用的,接下來我通常不會只是把檔案拿走(其實也不用拿走,檔案就儲存在專案資料夾中),而是會再給 Codex 一個復盤指令。這個復盤指令的目的,是請 AI 回頭整理:剛才它是怎麼完成這份有效簡報?這一次它是怎麼處理這份有效試算表?中間用了哪些資料、哪些步驟、哪些判斷,最後才做出這個可用成果?接著,我會請 Codex 把這些有效的工作流程,寫進這個專案對應的規則文件中。也就是讓 AI 自己去處理專案規則,自己建立各種工作規則,甚至建立後面可以繼續使用的技能。這樣之後在同一個專案裡,如果我要產出新的工作成果,就可以沿用類似的方法,而不是每一次都重新開始。這是我目前使用 Codex 時很重視的一個步驟:任務完成後,不只檢查成果,也要把有效流程留下來。這樣一來,這個專案底下就會慢慢訓練出一個越做越順手的 AI 工作助理。(延伸應用:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)前面這個簡報檔案製作的流程還不錯,幫我復盤一下過程,建立之後做簡報的規則。請一步一步處理,分析用了哪些工具、執行了哪些方法,把整個流程梳理出來,讓我們以後要做課程簡報的時候,也能用同樣的邏輯、同樣的規則、同樣的技巧、同樣的工具來完成一份可用性更高的簡報內容。最後寫進對應規則,或是新增更適合的課程簡報規則文件。Codex AI 助理處理任務時你可以善用的功能:能力、權限、排程、多工前面幾個關鍵階段,是我推薦非工程師、一般工作者剛開始使用 OpenAI Codex 時,最需要掌握的流程與步驟。當你開始讓 Codex 處理幾個任務,逐漸有經驗之後,這個軟體內建的一些功能,也可以開始做自己的調整與切換,讓它更符合你的工作需求。第一個需要調整的,是根據任務難易度,選擇合適的模型與執行速度。在對話視窗的右下方選單中,可以切換不同 GPT 模型,也可以切換智慧等級與執行速度。大致上可以這樣理解:模型與智慧等級:會影響它可以處理的任務複雜度,以及處理過程中的細緻度、準確度。執行速度:如果選擇快速,AI 會更快完成任務。額度消耗:模型等級越高、速度越快,通常也會消耗更多每週額度。 以我自己使用每月 100 美金的 Pro 版本來看,如果每天都利用 Codex 處理工作上的幾個重要專案,並且都「毫無顧忌」的使用最高等級、最快速版本,一週額度其實也會在不到一週內被消耗完。若是免費版或 Plus 版本,消耗速度就會更明顯。所以我的做法是,如果只是簡單任務,例如:理解一下專案目前的資料狀態。 做簡單資料分類。 處理一般文書整理。 初步檢查資料夾內容。 那麼可以選擇中~高等級的智慧功能,甚至切換到 GPT-5.4、GPT-5.3 之類的模型,速度選擇「標準」,讓它多花一點時間處理,但少消耗一些額度,這樣可以多做幾個工作任務。接下來,在對話視窗左下方,會有三種權限可以選擇。這裡我覺得一般工作者也要理解,因為 Codex 不是單純回答問題,它可能會真的改動你的檔案。大致上可以這樣區分:預設權限:幾乎每個改動步驟,AI 都會詢問你,要求你確認。自動審核:當 AI 的操作可能影響整個系統,或跨出你的專案資料夾範圍時,它會自己判斷風險。如果判斷是中高風險以上,就會要求你確認;如果是低風險操作,則可能自動允許。完整存取權:大多數時候不會經過你的確認,AI 會直接開始工作。 如果你要處理的任務,有可能影響整個系統,或可能改動重要檔案,我會建議至少選擇「預設權限」或「自動審核」。這樣在 AI 真正改變檔案之前,你還有機會做一次確認。Codex 有一個很好用的功能,就是當 AI 正在處理任務時,你還是可以繼續在下方對話框輸入下一步指令。因為有時候一個複雜的工作流程,可能要處理 10 分鐘,甚至 20、30 分鐘。我自己的經驗是,有些任務可能會處理超過一個小時,才能完成一個比較複雜的工作流程。這時候,你可以在下方對話框繼續新增下一個任務指引。如果直接按下 Enter,通常會選擇「排入佇列」。意思是:前一個任務完整做完後,Codex 才會接續執行下一個任務。這個功能很適合用在連續工作上。例如你可以連續添加兩、三個任務,每個任務可能都要做 20、30 分鐘。這時候你可以去處理別的事情,一個多小時後回來,這幾個接續任務就可能已經完成。如果選擇 Ctrl + Enter,則是「引導」。這個意思是:當 AI 正在處理前一個任務時,你可以把新的引導指令直接插入進去,讓它立刻接收到你的意見,調整正在進行中的工作。例如你看到 AI 正在處理一份圖文內容,但你發現它的編排方式不是你喜歡的,這時候可以立刻告訴它:改成左圖右文。 改成圖片在上、文字在下。 重新調整目前的排版方式。 Codex 就會馬上接收你的意見,調整做到一半的內容。這個功能很適合用在你已經看到 AI 的方向,但想要即時修正細節的情境。Codex 也可以同時開啟多個討論串。也就是說,你可以同時讓好幾個專案資料夾裡的 AI 助理,處理不同任務。例如:一個專案資料夾正在製作簡報。 另一個專案資料夾正在處理旅遊行程。 第三個專案資料夾正在幫你進行數據資料的統整與驗算。 透過多討論串並行的方式,讓 Codex 真的在電腦端幫你同時處理幾條工作線。進階使用:外掛、技能與自動化,讓 Codex 接上更多工作流程當你慢慢熟悉 Codex 上面的各種基本操作後,下一個階段,可以開始了解 Codex 的「外掛」、「技能」與「自動化」這些功能。這些功能的重點,是讓 Codex 可以接上更多服務,理解更多工作流程,甚至把已經跑順的任務變成固定時間自動執行。什麼是 Codex 的外掛?以我自己的工作情境來說,我常常有非常多的文件、簡報、試算表,是放在 Google 雲端硬碟中的雲端文件,而不是存在本機電腦硬碟裡。那這樣 Codex 還可以操作它們嗎?可以。方法就是在 Codex 裡安裝並授權 Google 雲端硬碟相關的外掛。當我們安裝 Google 雲端硬碟外掛時,通常會需要連接到 Google 雲端硬碟服務,進行帳號授權。授權成功之後,Codex 就會取得處理 Google 雲端硬碟中各種線上文件的能力。例如:Google 文件 Google 簡報 Google 試算表 Google 雲端硬碟資料夾 這樣一來,Codex 不只能處理本機資料夾中的檔案,也可以進一步處理我平常大量使用的 Google 雲端文件。安裝外掛後,通常也會連帶在 Codex 裡安裝對應的「技能」。什麼是技能?如果以前面的 Google 雲端硬碟外掛為例,當我安裝並授權這個外掛之後,Codex 的 AI 助理就會獲得一些相關技能,例如:如何處理 Google 文件 如何處理 Google 簡報 如何處理 Google 試算表 如何整理 Google 雲端硬碟資料夾 你可以把「技能」理解成:處理某種特定任務的工作流程與操作步驟。例如,Codex 透過技能理解 Google 簡報的操作邏輯,再搭配前面外掛提供的 Google 簡報編輯授權,這時候 Codex 就可以直接幫我製作或修改 Google 簡報。在 Codex App 的左上方,還可以看到一個「自動化」功能。如果我在某個討論串中,已經把某個工作流程跑順了,而且這個工作流程是我想要每天或定期重複執行的,就可以把它建立成自動化流程。例如:每週整理這個專案資料夾裡的新資料,建立一份週報。 每天處理這個資料夾裡的最新數據,建立今天的理財投資分析建議。 定期檢查某個資料夾中的新文件,整理成報告或摘要。 這時候,我可以直接要求 Codex 在這個討論串中建立一個自動化流程。之後到了指定時間,Codex 就會自動啟動前面已經訓練好的步驟,幫我完成任務。Codex 的自動化,大致可以有兩種設定方式。第一種,是在某個討論串中,明確告訴 Codex:要自動處理哪些工作步驟? 要多久執行一次? 要在什麼時間開始? 最後要產出什麼結果? 接著請它直接建立一個定期循環的自動化流程。第二種,是在一個已經討論到一定階段、而且工作流程已經跑順的討論串中,直接請 Codex:把前面這個已經完成的工作流程,建立成一個自動化流程。這時候,Codex 就會把前面已經跑過的流程整理成可以重複執行的自動化項目,等到固定時間到了,它就會自動處理。我們到時候只要接收報告或成果即可。利用 Codex 進行其它軟體視窗的 AI 語音輸入:在 CodeX 電腦端軟體中還有一個很實用的「聽寫」功能,就是透過 AI 辨識來進行語音輸入,有點類似前一陣子很流行的 Typeless 之類的語音輸入工具。它預設是關閉的,我們可以到 CodeX 的軟體端,在它的設定裡面找到語音輸入,然後設定一個電腦當中的快捷鍵,例如我在 Windows 裡面設定的是 Ctrl + T。接下來,只要我的 CodeX 軟體沒有關閉,我可以切換到電腦中其他的輸入視窗,例如我在 Evernote 裡面的筆記,或是現在這一段的部落格文章編輯頁面。這時候我只要按下 Ctrl + T,然後開始講出我想要輸入的相關內容。可以想一想,語音輸入的這些段落,都是由 CodeX 的語音輸入來完成的。講完之後,再按下 Ctrl + T,它就把你講的內容轉成文字稿;而且因為結合了 AI 模型,所以它可以自動加上標點符號、自動斷句,也會自動糾正你裡面的一些文字錯誤;大多數時候也都能穩定地輸出成繁體中文(但也有時候會變成簡體中文)。這樣應該就可以少安裝一個語音輸入的 AI 工具,直接用 CodeX 解決問題。任務越多時,要善用 Codex 的討論串分類與釘選功能:最後,當我們開始有越來越多任務在 Codex 上處理後,一些分類與管理功能也要慢慢掌握起來,否則最後討論串會變得越來越混亂。首先,在左方的專案資料夾底下,我們可以根據這個專案裡不同的子任務,開啟不同的討論串,避免彼此混雜。例如我有一個「外部資料庫/第二大腦」的資料夾,裡面包含:我抓取的重要參考資料原文 我的筆記卡片 已經建立好的永久筆記 在這個大資料夾底下,我就會開幾個不同的子任務討論串:一個討論串,專門處理每天的資料抓取。 一個討論串,專門處理內容草稿。 一個討論串,專門處理如何從這個外部資料庫,建立課程規劃。 這樣彼此區隔後,不同的 AI 專案助理,就可以在適合的子任務上,根據它需要的規則,完成更有效的任務。如果有一些子任務討論串,目前正在緊鑼密鼓地進行,我們也可以點一下左邊的圖釘,把它釘選在左上方。這樣它就會從資料夾中的一般列表,移到左上方更容易管理的位置,也能讓我們更快看到目前最重要、最常使用的討論串。簡單來說,當 Codex 開始變成你的電腦端 AI 工作助理後,不只要學會交派任務,也要學會整理任務。 把不同子任務拆成不同討論串,再把正在進行的重要任務釘選起來,會讓整個 Codex 工作流程更清楚、更容易長期管理。我不是工程師,也值得試試看 Codex 嗎?答案是肯定的。你可以根據這篇文章,從下面流程開始:建一個副本資料夾 放入雜亂資料 讓 Codex 先看不要動 建立專案規則文件 用成果、資料範圍、需求、驗收標準交派任務 任務完成後復盤寫回規則逐步測試,你也能慢慢地掌握 AI Agent 的工作方式。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程)
電腦玩物 · 2026-05-01 22:42
今天這篇測試文章中,一個最讓我驚豔的實測結果是, ChatGPT Images 2.0 做出連續多頁的圖解簡報,效果更接近工作可用,精確性與複雜度還比 NotebookLM 更高。一開始 AI 繪圖推出的時候,大家關注在 AI 能不能繪製出很擬真的照片、符合特殊風格的圖片。後來 Gemini 的 Nano Banana 繪圖引擎,讓中文內容可以更正確、更合理的出現在圖片上(延伸閱讀:活用三大 Google AI 教學神器,把複雜知識變成手繪心智圖、遊戲網頁、圖解簡報),不過當文字量增加到一定程度後,就會看到侷限。即使如此, Google Gemini 的 Nano Banana 依然非常好用,我大量應用在製作需要的知識圖卡,甚至孩子的學習教材上。(我如何用 AI 把親子生活變有趣: 7 種父母都能用得上的實戰流程,從複習、遊戲到溝通)而現在(2026/4/21) OpenAI 推出了「 ChatGPT Images 2.0 」,這款最先進的 AI 繪圖模型有一個讓我非常感興趣的能力:「 ChatGPT Images 2.0 」針對「文字密集型視覺」更加實用、多語文字渲染更好、更能遵循細節指令去排版、更適合做海報、資訊圖、講義圖表、多格漫畫、文件插圖、產品流程圖、內部工具畫面等等。針對 ChatGPT Images 2.0 在大量密集多語言文字處理上的突破,我想測試看看其是否能生成更接近可以拿來交付的工作圖像成果(測試後答案是肯定的),可以滿足那些簡報、圖解、海報、講義需要的大量文字、版面編排、多語言、統計欄與密集資訊區塊的版面需求。目前 ChatGPT Images 2.0 已對所有 ChatGPT 用戶開放(包含免費版本)。你可以直接在聊天裡啟動「創作圖像」功能要求生成圖片,網頁端與 App 版都可使用。而如果是付費帳戶,還可以使用 ImageGen 2.0 Thinking,會加入推理、多圖生成、web search等能力;官方描述是,它可以先研究、再推理、再把來源材料轉成視覺成果。ChatGPT Plus 以上用戶,可以選擇 Thinking 模式再加上創作圖像功能,體驗看看效果。。下面就直接分享我的幾個實測案例:測試:文字密集型視覺圖解測試:圖文密集講義替換不同風格測試:搭配真實人物的連續上課講解畫面測試:文章型內容的排版設計測試:做出連續多頁的圖解簡報(保持一致性,每頁都有大量圖文解釋)更新:ChatGPT GPT-5.5 結合 Images 2.0 ,直接拆解一篇文章,變成連續 10 頁圖解簡報如果你是 ChatGPT plus 以上版本,建議這樣試試看,啟動「 GPT-5.5 Thinking 模型」,同時啟動「創作圖像」功能,這時候可以梳理大量資料後,產出「連續多圖」內容,不僅保持一致性,每一頁內容的拆解也很精準,圖像也幾乎不出錯。例如,解讀一份資料後,直接產出 10 頁簡報圖,效果與正確性比 NotebookLM 更好。把下面文章拆解成連續多頁的教學簡報圖解,請一步一步設計,先讀取這段網址的教學文章正文( https://www.playpcesor.com/2026/03/ai-chatgptcodexopenclaw.html ),然後把裡面的圖片、文章拆解成 10 頁重點教學的內容。 簡報圖的目的是要幫助讀者更快的了解關鍵的方法,透過能夠讓讀者一頁一頁看下去的編排,每一頁都能有修收穫。 據此,產出一頁一頁,總共10張的簡報圖。測試:文字密集型視覺圖解我有一個 ChatGPT 討論串,專門討論防彈筆記法的各種內容(參考:ChatGPT 的 PARA 聊天室分類法:增強 AI 協作威力實戰案例分享),於是我測試看看, ChatGPT Images 2.0 是否可以同時幫我梳理聊天討論串中的各種技巧內容,然後製作出一張有完整數據資料的圖解。我用下面指令,讓 AI 總結前面討論,然後展開圖表的設計。這個指令中,我沒有刻意指定設計的風格與方式,而是讓 ChatGPT Images 2.0 自己思考適合的內容、適合的版面,自己去設計完成,也更能直接試試看這個新 AI 模型的處理能力。你是一頁式圖解說明專家,根據前面討論的數據分析資料,製作一份「防彈筆記法如何打造第二大腦系統」的一頁式圖解,請一步一步分析,根據前面討論,以圖解專家角度梳理要放入的數據與資料,思考最佳說明流程,從你的角度挑選一個跟主題搭配最適合的圖解風格、圖像元素,然後設計對應的圖像版面,完成這張圖解。下面是 ChatGPT Images 2.0 第一次就完成的圖解結果。這張圖片可下載,雖然解析度不算特別高,但也是可用的清晰度。上面的大量小字幾乎都正確生成(細看還是會有一兩個接近錯誤的怪字),而對內容的重新排版、版面的配置、搭配的圖像與流程,以一個方法論講義圖解來看,也沒有什麼可以挑剔的了。(可點擊圖片看大圖)測試:圖文密集講義連續修改、替換不同風格接下來,我讓 ChatGPT Images 2.0 處理最近一場直播講座的內容,直接梳理出另外一張圖解。文字的處理依然非常驚人,在一頁圖片上塞入這麼大量的文字內容,但幾乎都沒有錯誤。我也挑戰了讓 AI 把這張圖解替換成不同的風格,下圖是他產出的結果。所以我們可以用這樣的方式「連續多次修改」,但能保持內容正確性,又能調整風格與細節。(可點擊圖片看大圖)精簡文字內容,讓深入淺出,並改成在一張紙上寫下的手寫筆記風格。測試:搭配真實人物的「連續」上課講解畫面如果搭配真人照片與上課簡報效果如何呢?我上傳一張自己的講課照片,然後搭配前面的 AI 直播講座內容,讓 ChatGPT Images 2.0 幫我設計場景、放上人物,把直播內容變成一頁簡報。設計一張我在實體教室中正在解說上述一個核心案例的照片,請一步一步繪製,根據附件我提供的人物照片,挑選前面內容中適合的部分當作投影幕上的簡報,展現出我正在跟台下學生解說投影內容的畫面,以攝影專家角度思考真實照片應該有的光線、質感、氛圍,完成設計。接著,我讓 AI 維持人物與場景,但換到下一張簡報,這時 ChatGPT Images 2.0 也能準確地完成連續生圖任務,並保持一致性、連續性。再做下一張照片,同一個場景、人物,但切換到下一張投影片測試:文章型內容的排版設計那如果真的把一篇文章變成一頁排版呢?我把最近在 Facebook 貼的一則短文,交給 ChatGPT Images 2.0 用雜誌排版角度直接做成一張圖片。下面是我的完整短文與指令,可以比較看看 ChatGPT Images 2.0 完成的排版設計效果。你是雜誌專題報導排版專家,根據下面提供文章,製作一份「如何減少 AI 幻覺」的一頁雜誌專題報導版面,請一步一步分析,根據前面討論,以專家角度梳理要如何設計標題,可以搭配哪些圖解,思考最佳排版畫面,從你的角度挑選一個跟主題搭配最適合的設計風格、版面元素,然後設計對應的圖像版面,完成這頁排版。文章:###這個週末的大人學 AI 課程中,有學員在下課後問我:他常常問 AI 問題的時候,還是會覺得 AI 模型非常容易出現很多幻覺,常常給出一些不存在的證據或資料。這時候,到底要怎麼辦才好呢?我自己的解決方法是這樣,既然沒辦法要求 AI 不要有幻覺,#我就改變自己的工作流程。例如,我在 ChatGPT 裡,有一個長期拿來跟 AI 討論如何跟孩子進行溝通的討論串。但是,在這個討論串裡,我不是憑空就直接問 AI:要怎麼處理孩子的問題?要怎麼面對親子之間的關係?要怎麼跟孩子一起溝通?我會先自己去讀幾本國內外談親子溝通的書,把許多我讀過的相關書籍筆記,匯入 ChatGPT 的同一個討論串裡,先讓它建立基本的溝通知識、基本的科學證據。訓練好這個 AI 後,我才開始在那個脈絡裡跟它問答。(相關案例可以參考:用 ChatGPT 陪我讀英文原文書:5 個強化學習、筆記整理到行動轉化的 AI 技巧 https://www.playpcesor.com/2025/03/chatgpt-5-ai.html)這其實是我使用 AI 處理「任何問題、任何專案」時慣用的流程。很多時候,我們會以為 AI 可以直接從它內建的資料庫中,找出有效的東西來回答我們。但因為 AI 內建的資料實在太龐雜了,所以往往就會出現前面那位學員說的那種幻覺:說得好像有道理,但裡面的證據、資料、引用,其實都有問題。所以,如果我知道正確的資料是什麼、有效的文件在哪裡,只是我沒有那麼多時間自己梳理,那不如直接把這些資料文件丟給 AI 去整理,然後讓 AI 以這些有根據的內容來回答我,或者推演新的內容。而如果我不知道資料在哪裡的時候,我也不會直接就讓 AI 來解決我的問題。我反而會先讓 AI 自己去研究、自己去找資料。例如可以利用 Deep Research 這樣的功能,讓 AI 先深度找到那些有根據、有證據的內容,先建立基本的知識庫,然後再來回答我。關鍵就是:#先訓練AI建立基本的知識脈絡,然後再來回答我。當然,這樣的過程不是說 AI 就百分之百不會有幻覺。但我覺得,這會大幅降低 AI 回答有問題的比例。更進一步來說,什麼叫做幻覺呢?其實就像我們人在思考一件事情的時候,我看著一些參考資料,我研究一些數據、案例,但身為一個人,我還是會去想像、去推理、去思考有沒有其他可能性,我也會自己為這些資料做出詮釋。而當我們開始做詮釋、做推理的時候,其實某種程度上,就已經不再只是單純重複原本的資料了。我的想法(想像出來的方法)有可能是對的,也有可能是錯的。如果你把這樣的過程也看成一種幻覺,那麼當然,AI 無論如何,就算已經給了明確的證據跟資料,當它開始推理、開始思考的時候,也會跟人一樣,產生某種程度的幻覺。所以我自己反而不會把問題理解成:AI 到底能不能完全沒有幻覺?我更在意的是:它的資料來源是不是有根據?它的推理過程是不是合理?它提供的建議,我必須自己決定要不要再測試?要不要保持懷疑的態度,隨時調整?這樣一來,AI 有沒有幻覺,其實就不是一個那麼嚴重、那麼無解的問題。因為這是可以透過工作流程去降低、去修正、去克服的一種風險。我再請 ChatGPT Images 2.0 換一個風格,內容也依然保持了準確的一致性。(可點擊圖片看大圖)很好,但是改成像是紐約時報那樣的紙本雜誌、真實照片的排版風格對比一下,同樣指令與內容, Gemini 目前直接畫出的版本如下圖(被 AI 強制精簡文字)。測試:做出連續多頁的圖解簡報(保持一致性,每頁都有大量圖文解釋)最後這個案例,我挑戰讓 ChatGPT Images 2.0 來「製作簡報」。最近像是 Google NotebookLM 的圖解簡報非常流行(我的 Google AI 輔助簡報製作工作流程分享:從 NotebookLM 到 Google 簡報互補),但是圖片很驚艷,上面的文字正確性卻不好控制。ChatGPT Images 2.0 可以做到什麼程度?下面分享我的實做流程。我先把 OpenAI 官方介紹 ChatGPT Images 2.0 的文章,提供給 ChatGPT 分析資料,讓 ChatGPT 梳理出簡報大綱:我要製作一系列介紹 ChatGPT Images 2.0 的簡報圖,但請你先了解我想介紹的下面簡報內容:請一步一步閱讀:https://openai.com/index/introducing-chatgpt-images-2-0/#textmode接將上面理解,整理成「6 張系列簡報圖的腳本大綱」,一步一步處理,包含每張圖的標題、要放的關鍵文案、建議畫面結構。讓 ChatGPT 先完成簡報文字大綱的設計後,接著開啟創作圖像功能,讓 ChatGPT Images 2.0 開始一頁一頁設計(這邊我採用比較保守的作法,一頁一頁來)。你是課程簡報設計專家,根據上面規劃好的簡報圖1,設計出這頁16:9簡報,一步一步設計,根據上述規畫重新思考構圖、文字配置、風格,完成這頁簡報設計。下面我就直接把 ChatGPT Images 2.0 完成的 6 張簡報圖貼上,讓大家直接看實測結果,同時也可以了解官方文章中要傳達的重點功能。(可點擊圖片看大圖)從上述實測結果來看, ChatGPT Images 2.0 的 AI 繪圖能力關鍵是更能完成直接可用的工作成果。那些需要大量文字、圖解、排版、流程與知識的工作圖像內容,現在 ChatGPT Images 2.0 也能一次就生成有效的圖像,很值得納入工作流程使用。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:ChatGPT Images 2.0 工作專用 AI 繪圖工具:大量密集中文排版圖解、簡報案例實測)
電腦玩物 · 2026-04-22 11:32
測試:做出連續多頁的圖解簡報(保持一致性,每頁都有大量圖文解釋)最後這個案例,我挑戰讓 ChatGPT Images 2.0 來「製作簡報」。最近像是 Google NotebookLM 的圖解簡報非常流行(我的 Google AI 輔助簡報製作工作流程分享:從 NotebookLM 到 Google 簡報互補),但是圖片很驚艷,上面的文字正確性卻不好控制。ChatGPT Images 2.0 可以做到什麼程度?下面分享我的實做流程。我先把 OpenAI 官方介紹 ChatGPT Images 2.0 的文章,提供給 ChatGPT 分析資料,讓 ChatGPT 梳理出簡報大綱:我要製作一系列介紹 ChatGPT Images 2.0 的簡報圖,但請你先了解我想介紹的下面簡報內容:請一步一步閱讀:https://openai.com/index/introducing-chatgpt-images-2-0/#textmode接將上面理解,整理成「6 張系列簡報圖的腳本大綱」,一步一步處理,包含每張圖的標題、要放的關鍵文案、建議畫面結構。首先要說明的是,這篇文章我不會稱為是 AI 可以取代我們的第二大腦,因為我對第二大腦的嚴格定義在於我的專案、任務、行動與經驗管理,而這部分大多時候依然需要自己手動定義、整理與改寫,例如我讓 AI 處理參考資料,但是我需要自己筆記為什麼這樣做的目標?如何做的流程?怎麼做更好的經驗?而這也是我提倡的「防彈筆記法」的核心。所以這篇文章想要分享的經驗是,那些外部參考資料,有沒有可能利用 AI ,在不用額外花太多時間的情況下(人只要丟資料、給想法、下指導), AI 就可以持續整理、歸納、改寫、統整、延伸與檢驗正確性,讓 AI 自動完成一個人(我)可以隨時取用在工作、生活各種產出上的資料庫。而因為當 AI (或者 AI Agent )可以完成上述自動整理流程,並且在我的實做下,像是抓取資料、分類、連結、統整、筆記、畫出流程圖等功能都可以 AI 處理,人「不再需要操作軟體介面」,所以甚至可以做到 AI 本身就是資料庫工具,而我不再需要另外一個 Obsidian、 Notion 或 Evernote 來處理這些外部資料。Codex AI 助理上手教學:一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程延伸教學:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群延伸教學:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好用 AI 建立外部資料庫:讓「整理」與「操作工具」不再成為學習阻礙過年期間,我先用 Google 的 Antigravity,讓 AI 幫我做出一個可用的 RSS 閱讀器。那時候有讀者在底下提醒我一句:「如果直接用 OpenClaw 做,可能會更好。」那句話後來真的打到我。因為我腦中其實一直卡著一個更大的痛點:最耗時的工作,從來不是讀文章,也不是寫筆記,而是操作軟體去整理的時間。把文章結合自己的觀點整理成可重複使用的筆記卡、串聯不同筆記卡片、把相關卡片結合自己的想法變成更穩定的「永久筆記」,再把卡片串成可以拿來處理專案的流程架構、用於寫作的大綱、融入到課程中的方法綱要,這一整段流程,除了要花時間也應該花時間的:我的想法、觀點思考之外,其他很多步驟其實都是「軟體操作時間」。我想把時間留給自己的實做、思考、想法產出,但把所有軟體操作時間交給 AI。所以我後來做的實驗,並不是想再做一個筆記工具或稍後閱讀工具。而是:當我丟出資料、觀點、想法後,能不能讓 AI Agent 類型的助理,直接且自動幫我完成下面工作:處理我本機資料夾裡的 md 文件。抓取無論網頁、 YouTube 影片、社群貼文中的內容,建立「參考文獻」。根據我的觀點整理出筆記摘要,建立某個工具、觀點或技巧的「暫時筆記」。根據我的需求建立未來各種任務產出可以參照的穩固方法論的「永久筆記」。在不同永久筆記之間建立連結,可以看到層級關係,乃至於「知識架構圖」。根據我未來出現的任務、產出,挖取這個外部資料庫,提供我架構、論述、案例、方法大綱。關於卡片盒筆記法中的文獻、永久筆記、筆記連結的教學,可以參考我之前的兩篇文章:如何從暫時筆記到永久筆記?如何建立筆記連結?分辨這 5 種筆記,你就能建立高生產力系統如果講得再白話一點:我不是想打造另一套第二大腦、外部資料庫、稍後閱讀軟體,我是想訓練一個能持續幫我整理外部參考資料的 AI 專案助理。目前的實際流程示範:以 Codex 為例,我丟網址、丟想法,讓 AI Agent 在本機 md 資料夾裡建立資料庫一開始(2026/2 時),我是利用當時很流行的 OpenClaw 來架構這個 AI 整理外部第二大腦的流程,只要在 Telegram 丟一個資料網址,告訴他我的觀點, AI 就會跑完筆記卡摘要與改寫流程,接著自動建議我可以補充到哪些永久筆記,我再補上觀點後, AI 就會持續的穩固我既有的永久筆記系統,並在更新之後幫我調整目前知識架構圖。但是目前,我主要利用 ChatGPT 的 Codex 來完成這個流程。無論用哪種工具,包含很流行的 Claude Cowork 當然也可以,只要 AI Agent 能讀寫本機 md 文件,又能照著你定義好的流程工作,它就能慢慢接手原本要靠稍後閱讀工具、數位筆記工具、手動剪貼整理才能完成的大量知識整理工作:一個由 md 文件組成的外部知識庫一套由 AI Agent 維護的整理流程一個能回收成卡片、永久筆記、文章草稿與流程圖的工作系統AI 工具可能未來會換,但這個資料庫與流程會留下來,可以持續使用。(參考:不同 AI 工具如何分工、接力完成專案,分享我做一個象棋教學遊戲的流程)下面就先具體示範我目前的資料庫工作流程,後面再分享其中幾個關鍵細節。讓 Codex 在本機資料夾建立資料庫:首先,我建立了一個本機資料夾,讓 Codex (或者你也可以用 Claude Code 或 Claude CoWork)來管理其中的各種文件(資料庫的核心,以 markdown 的 md 檔案為主),在這個資料夾建立需要的小工具(例如抓取 YouTube 字幕的 Python 程式),以及建立工作流程、知識處理規則的 md 文件(這些規則文件,可以讓不同 AI 助理共同遵循)(規則文件非常重要,可參考:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)。除了因為我本來就有 ChatGPT Plus 版本(前幾天更新到 Pro 版本),我用 Codex 還有另外一個原因就是他前一陣子推出桌面軟體端,我更喜歡在這個簡單易懂的對話介面中進行工作流程。只要在 Codex 中開啟要用來做資料庫的本機資料夾,接著就可以用對話來建立工具、打造自動流程、處理各種資料夾內的文件檔案。在這個流程中,我讓所有資料、知識、草稿、驅動 AI 的規則技術文件,無論是文獻還是永久筆記,全部用 md 文件格式儲存在這個本機資料夾。我沒有像很多朋友那樣搭配 Obisidian 等功能來管理,因為我想嘗試:「工具就是 AI Agent 本身」,而人「盡可能」不要操作任何軟體介面與功能,人唯一需要的就是「跟 AI Agent 對話」。 而雲端同步的功能,我則是要求 Codex 自動幫我推送到 Github 做版本控管,也能在雲端網頁上讀取我的完整資料庫。建立 Codex 處理資料庫的基本規則:我先對 Codex(一開始其實是在 OpenClaw,但方法都一樣) 定義好抓取所有資料的共通流程,主要的原則有下面這些,而這些原則是來自於我多年來對一個知識管理系統研究後的架構(先貼給 Codex ,請他建立一個之後一定會遵循的規則文件):核心流程:抓取來源 →建立 raw 全文證據庫 →根據我的觀點摘要 card 筆記卡 →更新或建立 opinions 永久筆記 →需要的時候根據資料庫內容,進行每日 digest / 寫作大綱 / 關鍵論述輸出 → GitHub 版本同步raw 資料夾(文獻):是全文證據庫,不能自己省略;抓不完整就不算完成。要注意抓取來源、時間等細節。card 資料夾(暫時筆記):是一篇原文一張卡,保留我的觀點、摘要、引用、應用情境、下一步行動。opinions 資料夾(永久筆記):這才是第二大腦核心,重點是更新既有母筆記,不是一直新增新筆記,讓一個主題愈來愈完整。所有永久筆記更新時,要做判斷屬於哪一種知識:PROJECT = 正在進行專案,通常是我定義的跟我目前想要研究、進行的主題工作有關(例如這個外部資料庫專案)WORKFLOW = 未來可參考的工作流程,包含操作步驟、最佳範例。METHOD = 專案與工作流程通用的方法論,包含理論、證據。新增 cards 後,必須檢查 opinions 是否需要回填,強制要求 AI 要做這個檢查,主動提供建議,讓 raw 變成 card ,再補充到 opinios ,最後永久筆記愈來愈完整。但若要新增全新永久筆記,要先取得我的同意,避免資料庫最後發散混亂。額外的連結與流程圖所有的 raw 並須連結到原始來源,所有的 crad 必須有 raw 的連結,所有的永久筆記必須有 raw 或 card 的連結。而永久筆記之間也會互相連結,並建立一個知識架構圖。每次更新永久筆記後,要同步維護 INDEX(總目錄)、MAP(知識架構圖),讓整個資料庫的體系愈來愈完整。上述的規則,一開始先讓 AI 寫進一份 Workflow.md 的文件中,文件放在這個工作資料夾的根目錄,並邀請 Codex 等 AI Agent 每次處理工作時優先遵循這個規則。但是你說,下面的規則看起來比上面的簡單版完整很多啊?那是因為在兩個月的實踐過程中,每次 AI 的處理有調整,或是處理得很不錯的時候,我都會請 AI 自己復盤,把目前學會更好的處理規則更新回規則文件,這樣 AI 助理之後的工作就會愈做愈好。(延伸閱讀:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)讓 Codex 根據網址抓取文獻、建立筆記,逐步擴充資料庫:有了上面的共通原則後,第一階段我要先讓 Codex 幫我抓取文章,當我看過一篇感興趣的文章、YouTube 影片、社群貼文後,我就把網址丟給 AI Agent( Codex ),並希望 AI 能夠自動抓取資料全文建立文獻(raw),同時製作一張有我的觀點的筆記卡片(card)。我那時候的第一步是從下面這段丟給 AI Agent 的指令開始啟動的:根據前面的專案原則,我想建立一個自動整理與成長的資料庫。請一步一步處理:1.請你先不要做自動抓取,先在 workspace 建立以下資料夾結構:raw/(放原始文章)card/(放整理後筆記卡)digest/(每日總表,回顧每日資訊總結)2,接著請你建立一個「整理腳本」或「工作流程說明」,讓我每次把網址、文章文字,以及我的觀點貼給你時,你就會自動抓取全文放入 raw ,並自動產出符合以下模板的筆記卡到 card。模板如下:###檔名:YYYY-MM-DD - {title}.md內容:- 來源:- 原文連結:- 原文日期:- 主題標籤:#AI工具 #工作流 #筆記術(最多 3–5 個,並保持一致性,同一個主題共用同一個標籤)一句話結論(我需要記住的)(<= 40 字)重點摘要,結合我的觀點,盡量搭配使用原文,但翻譯成台灣慣用繁體中文(翻譯後同時附上原文參照)1. 2. 3. 4. 核心概念表格:概念作者怎麼說根據我的觀點,我可以怎麼用(對工作/寫作)對我有用的 3 個應用情境- 情境 1:- 情境 2:- 情境 3:今天能做的下一步:測試、研究、寫作(務必具體)- 待追問(下次研究關鍵字)###不過根據不同情況,就算有上面基本規則,事情也不一定馬上就能順利,但這時候我就都交給 Codex 這樣的 AI Agent 去解決。例如有時候抓不到網頁全文?無法抓到 YouTuhe 字幕?有些社群抓不到我想要的指定網址的貼文?我就把問題丟回給 Codex ,讓他找方法解決,可能寫一個 Python 小程式,或是需要申請一個 API ,但就一邊做,一邊讓 Code 幫我補足這些抓取功能。或是當我發現有時候 AI 根據我丟的網址,抓到部分資料,但沒有抓到全文,於是我就讓 Codex 寫一個自動檢驗小程式,並讓 AI 在他必定要遵循的規則文件中加上:「抓取文章後一定要跑這個檢驗程式,確定有抓到頭尾完整的內容。」所以現在我的這個資料夾中有抓取網頁小工具、PDF轉換小工具、抓取 YouTube 字幕小工具、抓取特定社群貼文小工具等等,這些小工具也都是 Codex AI 自己撰寫。讓我每次只要丟一段網址,提出我的觀點, Codex AI Agent 就會自動完成基本的兩大步驟:先抓取完整內容,建立有引用來源的文獻。再根據我的觀點,建立筆記摘要卡片。例如我讓有了上述基本原則與工具的 AI 來抓取我的這篇文章:「與 AI 助手合作後的第二大腦系統,我在筆記方法上的變與不變」。我這樣提問:抓取下面文章,根據我的觀點建立筆記卡。 我認為在知識管理上應該善用 AI ,但要明確區分 AI 可以做的資料管理,以及人要主動引導與建立的專案、經驗的真正知識管理,才是好的工作流程。文章網址: https://www.playpcesor.com/2026/01/ai.html我每一天大概都會隨手丟上5~10篇連結,加上我的一兩個核心觀點,通常是我快速讀過後有啟發的文章、影片、PDF或貼文資料。然後 Codex 這樣的 AI Agent 可以自動做完兩件事,新增兩份文件:幫我自動抓取全文建立文獻,並建立一個符合我觀點的筆記卡片。下面就是 AI Agent 自動完成的筆記卡,裡面結合了我剛剛丟給他的觀點,以及原文內容,但也包含已經在這個資料庫中的相關內容延伸。這兩個月的累積,我就透過 AI Agent 的抓取、整理,建立了數百則的文獻資料與觀點筆記卡(類似上面這樣,有摘要、有觀點、有延伸應用的內容)。讓 Codex 根據暫時筆記,建立「永久筆記」的連結系統:不過這樣還不夠,如果這些文獻、觀點筆記卡都是散亂的根據時間排序,其實很難有效使用,但我也不想要在這個暫時筆記的層級去做分類或連結。所以我建立了一個「永久筆記」的自動整理邏輯,只要我丟出進一步觀點給我的 AI Agent ,他就會根據前面抓取的筆記卡,思考是否要新增永久筆記,或是要補充、修正之前的某一張永久筆記,透過 AI Agent 的自動化流程,讓「真正可以在未來拿出來反覆利用」的永久筆記系統愈來愈完整。下面是我提供給 AI Agent 的永久筆記規則。(只是參考,讓大家看到一份規則文件,可以引導 AI Agent 多步驟去自動化完成工作,指定 AI 去使用哪些工具,以及 AI 一定要遵守的關鍵原則。)永久筆記(opinions/):把 cards 統整成可複用資產(必讀)永久筆記新增/更新的標準作業(必遵守)0) 觸發規則(硬性):每次「新增 cards」後都要檢查 opinions 是否需回填只要新增一張 cards(或對 cards 有實質增量更新),都必須立刻跑一輪:這張 cards 的「新有效內容」是什麼?(新判斷標準/新風險/新步驟/新框架/新清單)對照 opinions/INDEX.md:要更新哪一張母筆記?還是需要新增?依 routing 規則決定回填到 PROJECT / WORKFLOW / METHOD原則:更新優先;新增需 Esor 同意。0-1) 回填前的人機確認(硬性):先展示 cards 重點,再詢問 Esor 是否要回填在真的動手更新 opinions/ 前,先做這 3 件事:先展示這次 cards 的重點摘要(建議 3–5 點)明確詢問:這次要不要回填到永久筆記?明確詢問:Esor 有沒有補充觀點、反對意見、或想強調的版本?沒有先問,就不要直接改 opinions/。若 Esor 明確表示「先不要更新永久筆記」,就停在 card 階段即可。1) 更新/新增前:主動詢問 Esor 的想法(用以重現你最近示範的流程)在要更新/新增永久筆記前,先問:你自己的觀點/你要強調的主張是什麼?你希望這次回填後,永久筆記「更能做到什麼」?(未來要拿來用的價值)收到回覆後:把想法延伸改寫成更完整論述並融入正文(不是只貼一句備註)。2) 回填位置原則:更新永久筆記不固定更新在哪一節(以內容適配為主)不要硬塞在「套用方式」。以內容類型決定寫進哪個欄位/段落:一句話原則:當 cards 帶來更好的總結主張Dealbreakers:當 cards 帶來新的翻車點/一票否決條款套用方式:當 cards 帶來新的可執行步驟/做法常見誤區:當 cards 帶來新的錯誤認知/誤用型態Evidence / Links:當 cards/raw/opinions 的證據鏈或結構關係需要補齊3) 永久筆記寫入規則(引用/證據/索引)先查 opinions/INDEX.md:確認是否已有母筆記(更新優先)。依 routing 規則決定回填到 PROJECT / WORKFLOW / METHOD。寫入時要「整合改寫內容」進正文(不是只補連結),並在段落後附 (來源:...)。若內容包含 Esor 的補充觀點:在段落末尾加註 (來源:esor 補充想法,YYYY-MM-DD),並搭配對應 cards/opinions 作為支撐來源。Evidence 優先 raw;Links 只連永久筆記。新增全新永久筆記需 Esor 同意。每次新增/更新永久筆記後:更新 opinions/INDEX.md + opinions/MAP.mmd,再跑 opinions_linker.py。原則(防彈筆記法):永久筆記主題優先順序=專案任務名稱 → 工作流程名稱 → 方法論名稱;不是破碎的單一論點。rss_cards/:一篇原文一張卡(保留證據與脈絡)opinions/:把卡片統整成「可維護、可驗收、可回存」的長期資產A) 永久筆記的三種卡型與模板PROJECT(專案任務):projects/rss-second-brain/opinions/TEMPLATE_PROJECT.mdWORKFLOW(工作流程):projects/rss-second-brain/opinions/TEMPLATE_WORKFLOW.mdMETHOD(方法論):projects/rss-second-brain/opinions/TEMPLATE_METHOD.mdA-0) 最重要原則:優先「更新」既有永久筆記,而不是一直新增永久筆記的核心不是新增,而是把新知/新做法回填到既有的母筆記(Project / Workflow / Method)。新增條件(很少):你確定這是一個全新的專案任務/全新的可重複流程/全新的方法論框架;而且在 opinions/INDEX.md 找不到對應母筆記。預設策略:先查 opinions/INDEX.md 是否已有母筆記有就更新(加步驟/驗收/反例/回存/證據鏈)沒有才新增B) 永久筆記索引與關係圖索引(新增前先查,避免重複):projects/rss-second-brain/opinions/INDEX.md關係圖(Mermaid):projects/rss-second-brain/opinions/MAP.mmd必遵守:每次新增/更新永久筆記後,都要同步更新 INDEX 與 MAPINDEX:確保每一張永久筆記在 PROJECT / WORKFLOW / METHOD 某一區塊下有一條索引。MAP:新增節點並至少連一條關係(例如 PROJECT→WORKFLOW)。C) 永久筆記「連結維護」機制(每次新增/更新後都要做)目的:避免 Project↔Workflow↔Method 漏連結。觸發時機(何時要跑?)你「新增或更新任何一張永久筆記」後:必跑一次。下面讓我做一個「自己不丟觀點的示範」(通常真實流程,我會加上更多想法再更新永久筆記),看看 AI Agent 是否會依照上述規則,把前面 AI 建立的筆記卡,更新到永久筆記系統。我這樣對 AI 提問:根據剛才新增的筆記卡,根據永久筆記建立規則,分析適合更新或新增到哪些永久筆記,並提出具體建議。於是訓練好的 Codex ,就會根據我給他的永久筆記建立規則,AI 拿著剛剛建立的筆記卡去撿索我的永久筆記系統,找出適合更新或新增的永久筆記,並分析內容,給我更新建議。我可以根據 AI 助理給我的建議進一步思考,然後回給 AI 一個明確的整理指令,例如:只根據首選方案更新既有的永久筆記。下圖可以看到, Codex 根據我建立好的永久筆記規則,完成剛剛那則筆記卡更新到永久筆記的任務。AI 可以同時完成:把筆記卡的關鍵內容,更新、修正到指定的永久筆記。擴充永久筆記時,也會加上來源筆記卡的註記。自動在永久筆記的目錄、流程圖系統中做好更新。前面幾個階段跑下來,我們只是丟資料、給觀點、下自然語言指令,這就節省了非常多我們自己操作軟體介面的步驟。永久筆記完成的結果像是下圖這樣。於是我這兩個月打造的 AI 外部資料庫系統,就在這樣「不斷讓 AI 自動更新永久筆記」的流程中,慢慢擁有了一些系統性的、更深入完整的知識與方法,方便我後續拿出來利用。而為了讓永久筆記也不只是單篇方法,而是可以系統性利用的架構,所以我讓 Codex 去做出一個連結目錄,生成一個畫流程圖小工具,隨時用目錄連結與圖解方式,展開這個永久筆記系統的全貌。這兩個月,我的數百篇筆記卡,其實也才建立了二十幾則永久筆記,大多數都是把新的筆記卡更新到既有的永久筆記上,強化那些方法論與工作流程,但這正好可以看到持續更新的永久筆記的深度。(而且我本來就偏好用更新筆記,取代新增筆記:每天新增30則筆記?還是更新30則筆記?兩步驟建立穩定筆記系統)利用 Codex ,根據目前的永久筆記、筆記卡、參考文獻,進行草稿產出:我大概是從二月開始這個實驗(一開始用 OpenClaw ,後來 ChatGPT 推出 Codex Windows 桌面軟體版後就改用 Codex ),我現在的外部知識庫裡,至少會分出幾層:raw:原文全文,保留可追溯、可驗證的來源card:每篇內容整理成可回收利用的筆記單位opinions:把重複出現的觀點、方法、流程,整理成會越用越強的永久筆記digest / outline / draft:把前面的知識層再推進成可以發布的輸出準備最後第四個層次,則是看需求,讓 Codex 在既有的這個外部資料庫中做產出。例如最新新增了比較多的新資料,我就會讓 Codex 做一個「 Digest 」總結。根據規則,把最近一個禮拜新增的筆記卡、更新的永久筆記,做一次快速復盤的摘要。或者我要做一個專案,我要產出一篇報告,我提供一些想法,然後讓 Codex 在這個外部資料庫中產出草稿。我需要到學校教一個 Google 的 AI 工作流程,根據我的永久筆記出發,搭配有更多細節的筆記卡與文獻,建立一個有效的工作流程大綱草稿,先直接秀出給我看,我再決定是否加入草稿資料夾。總結:我學到的 AI 工作流程我覺得這次實驗,但也已經變成我的一個處理外部資料庫的流程,真正學到的不是 AI 幫我做了很多事,可以自動化。是我開始學會:AI Agent 是可被設計的 workflow如果你只是把 AI 當成問答工具,它每次都只能重新猜你的標準。但如果你把流程、交付物、驗收、回存方式都定義出來,它就會越來越像一個真的專案助理。差別不在模型更聰明,而在你有沒有把它當成流程在設計。不會寫程式,也可以利用 AI 建立自己的工作系統,但要學會分派工作+驗收工作這次我其實沒有自己手動寫程式。很多技術性工作,都是交給 AI 處理。但我真正需要做的事情是:說清楚我要什麼交付物說清楚限制與標準看結果是否真的符合需求,再讓 AI 調整第二大腦真正該留下來的,是流程與規則我現在越來越覺得,工具其實不是最重要的。無論是各種 AI 工具,還是各種筆記軟體,各自有不同強項。但真正讓它們能幫我做事的,不是因為哪個工具特別神,而是因為我們自己有一套流程:哪些資料要保存哪些資料怎麼整理哪些內容值得回存哪些輸出要怎麼驗收工具可以換,但流程會留下來。甚至利用 AI Agent,打破工具操作流程,打造更靈活的資料庫。AI 的工作不是替我思考,而是替我處理那些我以前不想花大量時間做的外部資料整理工作。而我自己真正保留的,是:提出問題提供想法做最後判斷驗收哪些內容值得留下來真正的核心反而是:我能不能把自己的整理流程拆解清楚,然後交給 AI Agent 去處理那些原本最耗時、最容易拖住你的操作型工作。如果可以,那麼我們未來要管理的,也許不再是越來越多的工具介面。而是一套會在自然語言對話、規則文件、md 資料夾與驗收流程中,慢慢長出來的外部知識庫。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得)
電腦玩物 · 2026-04-12 22:46
有一次週末時間,跟孩子一起下象棋,孩子提議如果有一個象棋遊戲兼教練,可以讓我們透過跟電腦對戰來提升棋力,或者我們兩人一起討論策略去贏過電腦,這樣也是另外一種有趣的玩法。當然,市面上一定有這樣的象棋 App 可以直接滿足上面需求,但我想說,有沒有機會利用半天時間,試試看自己用 AI 做出一個象棋軟體呢?但是,今天這篇文章,主軸不是要說怎麼開發,不是要教怎麼 Vibe Coding ,更不是要提倡 AI 寫程式有多厲害,因為我不是真正的開發者,所以不會在這一塊班門弄斧。我是想從非工程師的角度,分享怎麼運用多種 AI 工具去完成一個專案的流程,讓不同的 AI 模型各司其職,但又能彼此接手工作的方法。從經驗談的角度出發,這個流程我也會套用在其他不同工作的專案上,或許你也可以舉一反三應用在其他地方(只是做的成果不同,搭配的 AI 工具不同)。Codex AI 助理上手教學:一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程延伸教學:不用寫程式的瀏覽器自動化:Codex for Chrome 幫我操作 Google 地圖、Evernote、 Gemini、社群延伸教學:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得為什麼一個任務成果,需要多個 AI 工具接手?(非工程師角度)其實,一開始小孩說想要有一個象棋遊戲可以玩,我的第一個想法是:直接用 Google Gemini 的 Canvas 做一個線上可玩的象棋小遊戲就好了吧?下一個簡單的指令,確實 Gemini 在兩三分鐘後就給我一個可玩的原型版本。但是,實際跟小孩一起玩玩看之後,小孩說電腦不夠聰明、有些規則有問題、想要加上一些特效、音效或特殊功能,又更進一步的希望能夠記錄棋譜、能夠紀錄成績、能夠有「電腦的指導教學」。原本想說就繼續讓 Gemini 在一個網頁原型上「硬改」看看,結果發現因為缺乏前期有效規劃,愈改愈亂, 30 分鐘後還達到 Gemini AI Pro 問答生成程式碼的區間額度限制。於是才想說,那不如讓不同 AI 工具來分工完成看看?於是我又花了大約兩個小時的時間,讓不同 AI 工具接力,完成了目前常常拿出來跟孩子一起練習象棋的工具。我先把這個「有點認真的象棋遊戲+教學教練」的專案,切分成幾個階段,然後根據我對幾種 AI 工具的判斷,將每個階段交付給適合的 AI 工具去處理:ChatGPT 做前期研究與規劃 Gemini 做快速原型測試Google AI Studio 生成整個專案骨架 Antigravity 做進階功能延伸 Codex 做最佳化、多檔案重構、長期維護但是怎麼讓不同 AI 工具接手同一個專案,而且還能維持邏輯一致,可以立即上工,並且可以根據不同 AI 工具的特性,解決這個專案的不同層面問題呢?這篇文章就來分享自己的經驗談。專案階段我選擇的工具核心任務為什麼適合0→1 構思ChatGPT研究資料、概念發想、規則梳理探索力強1→10 原型Gemini快速做出可玩介面做出視覺與互動原型快10→40 骨架Google AI Studio生成專案檔案骨架一次性產出基本架構40→70 工程Antigravity精準改檔、測試、重構細部修改與強化功能70→∞ 維護Codex最佳化、補功能長期穩定修改與維護ChatGPT 階段:資料研究、概念發想、專案規劃、技術選擇、遊戲邏輯分析我意識到自己前面第一次直接在 Gemini 讓 AI 做一個象棋遊戲時:沒有先做好研究與規劃,所以之後愈改愈亂。而這一次,我先在 ChatGPT 中建立一個討論串,讓 ChatGPT 先去搜尋研究象棋規則,調查目前象棋遊戲的設計邏輯,進一步分析小孩的喜好與想法。讓 ChatGPT 透過調查研究,先掌握要設計象棋遊戲的基本知識與技巧。然後我還用錄音訪談的方式,透過聊天,錄下小孩想要什麼樣的象棋遊戲,希望有哪些功能,甚至鼓勵他天馬行攻的想一些特殊玩法。然後把這段訪談錄音轉成逐字稿。最後,我把逐字稿也上傳到 ChatGPT ,請他用前面研究過的知識、技術,幫我重新整合成一個我的小孩真正需要且會喜歡的象棋遊戲專案計畫。你是孩子的遊戲設計助理,我要幫孩子設計一個線上象棋遊戲,先幫我擬定一個遊戲專案規劃。請一步一步分析,上網搜尋中國象棋的基本規則、玩法,然後搜尋類似遊戲設計案例,思考必備的線上網頁遊戲基本規劃。 接著根據前面你對我和小孩一起玩遊戲的喜好理解,解讀下面我訪談小孩想要的遊戲機制,根據前面你的基本中國象棋遊戲設計架構,根據你的遊戲設計專家角度重新思考,規劃出最適合我和小孩玩的中國象棋遊戲設計專案規劃企劃案。 訪談內容:###最重要的是在 ChatGPT 充分研究後,先寫出一份包含要用什麼技術、象棋規則怎麼導入的專案規劃書。之後換到不同的 AI 工具接手,就可以先「交接」這份規劃書,讓接手的 AI 立刻掌舵狀況。Gemini 階段:快速產出可玩的原型介面,確認可行我很習慣任何專案一開始(不只是做一個小工具或遊戲,也包含一個知識產品、活動企劃等等),都先像前面一樣,讓 ChatGPT 去調查、研究、分析,經過學習後,擬出一份符合我需求的專案規劃書,然後再開始工作。而以這個象棋遊戲為例,接下來我需要快速試試看這個專案規劃的一些基本功能,例如電腦對戰、創意技能等等,是否可行?於是我又回到 Gemini (超過限制時間後,額度又回來了),把 ChatGPT 的專案規劃丟上去,請她盡可能做出專案上她可以做得到的功能。初期要測試看看專案概念是否可行,產出可執行的原型(或是網頁、圖像、簡報等等產出), Gemini 確實很快就能做出有外觀介面、有基本互動的成果。我先用這個方法,確定 ChatGPT 做出的專案規劃基本可行,後面才有機會一步一步加上更多功能。(例如如果需要更進一步的後台資料庫、棋譜、電腦思考棋步的運算邏輯、電腦可以推演棋步做教學等,就無法只是在 Gemini 上就做出來。)Google AI Studio 階段:生成整個專案骨架如果要一個認真、可玩、長期練習的象棋遊戲,需要一個完整的程式架構,所以在 Gemini 先用幾分鐘確認可行,有機會做到後,我就轉換到 Google AI Studio 來生成這個專案的基本骨架。我一樣把前面 ChatGPT 寫出來的專案規劃書貼上 Google AI Studio ,請內建的 Gemini 3.1 Pro 根據規劃書,開發一個象棋遊戲。Google AI Studio 會「一口氣」生成專案需要的介面、功能、前端、後台等各種程式與檔案。例如在我的這個例子中,除了完成前端的介面互動與棋盤設計外,他也幫我寫了一個新的xiangqi.ts(象棋規則引擎,其實有既有的引擎,不過 AI 這邊自己寫出一個),思考了小孩想要的「特殊功能」如何跟正規象棋規則分開。對比來看, Gemini 做出有畫面的基本功能,但專案規劃書有很多特殊能力他無法做到。而 Google AI Studio 因為可以架構更完整的程式碼,所以像是電腦下棋難易度的分析等等都可以一口氣做完。不過因為 Google AI Studio 有一個問題,生出架構後,當然還需要修改,例如有些程式擠了太多規則變得肥大,或是高難度的電腦因為運算太久導致卡住,面對象棋特殊局面的規則還無法有效處理,因為純演算導致電腦開局反而比較笨等等。這些問題本來我也想要在 Google AI Studio 改,但 Google AI Studio 畢竟是測試用環境,他的「記憶能力」不太好,幾次對話就會忘了前面的專案目標與規則,不適合長期迭代修改。所以我把它完成的基本象棋遊戲程式碼「下載」到本機電腦,改用 Google 的 Antigravity 來進一步修改更細節的功能。Antigravity:完整的開發代理,接手骨架,做進階功能添加我是使用 Google AI Pro 的帳戶,所以在 Antigravity 上有一定的 Gemini 3.1 Pro、 Claude Opus 額度,但這個額度也沒有很高,我的經驗是如果幾個小時連續運作複雜程式修改,往往就要隔幾天才能再使用。Google Antigravity 能夠處理本機上指定資料夾內的檔案、文件(當然還有程式碼),簡單好用,他可以做到(後面的 Codex 也可以):直接操作指定資料夾內的:讀、寫、建立、刪除檔案執行終端命令瀏覽器自動化測試:可以打開 localhost、點按鈕、截圖驗證記憶能力很好,可以維持專案改進過程的上下文精確的編輯:可以只改第 157 行而不動其他地方多檔案協同重構:同時修改多檔案並保持專案一致性也可以用現在最流行的方式做專案管理:維護各種專案規則的 md 文件我讓 Google 的 Antigravity 先接手處理剛剛 Google AI Studio 完成的象棋遊戲基本骨架,然後先加上幾個主要的功能。第一步,我讓 Google Antigravity 先閱讀目前專案程式碼,然後再看一次前面 ChatGPT 規劃出來的計畫書,比較一下兩者異同,掌握專案現況,思考接下來專案應該怎麼開發。更重要的,先建立一份未來可以依循的「專案規則文件」。(延伸閱讀:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)接著我讓 Google Antigravity(或者說它內建的 Gemini、 Claude )找出目前專案根據規畫還可改進之處,然後我把改進變成一個一個任務,貼上去讓 Antigravity 接力修改。不過因為知道 Antigravity 的額度有限,加上我其實更喜歡使用 Codex ( OpenAI 的程式開發工具),未來一定會再交給 Codex 接手。為了讓之後接手更順暢,當 Antigravity 這邊做了什麼大改動,就請他在專案相關規則文件中做更新、對齊進度、修改最新規則等。Codex:系統的最佳化,長期的維護、修改現在這個象棋遊戲的專案,則已經轉移到了 OpenAI 的 Codex 繼續接手。既然如此,為什麼不乾脆一開始就會 Codex 做呢?我的想法是,在 ChatGPT 上做搜尋、研究、調查(Deep Research),先進行資料的統整分析,然後做專案規劃的討論,是比較適合的。所以我把想出專案規劃書這一步,交給 ChatGPT。既然要做認真的 App ,確實就不會只是用 Gemini 的 Canvas 製作,但可以先用 Gemini 測試看看外觀做出來是什麼樣子,基本的規劃邏輯跑得動嗎?倒是不一定需要用 Google AI Studio 製作出遊戲骨架,這一步也可以直接就交給 Antigravity 或 Codex,所以後面三個 AI 程式開發工具互相接手,考量的其實是「額度」的問題。雖然我有 Google AI Pro 和 ChatGPT Plus 帳號,但畢竟本職不是工程師,沒有真的採用買 Token 額度的方案,而這時候這兩者在用 Antigravity 或 Codex 做工具時的額度也都是有一定限制,如果用得勤快一點,在循環時間內的額度常常是不夠我用的。所以我就採用了讓三種 AI 程式工具互相接手的方式。下面是我這次經驗,不同工具分別開發了哪些功能:ChatGPT:做了許多搜尋、研究、分析,寫出專案規畫出。Gemini:只是測試看看做得出來嗎?Google AI Studio :完成基本的程式骨架。可玩的電腦對戰象棋遊戲。Google Antigravity:製作本機可以啟動的執行檔。完成程式碼版本控管與同步規劃。改進電腦運算規則,讓電腦棋步有難度、但也不會導致卡頓。加上開局棋譜等資料庫,強化電腦的下棋能力。進一步改進特殊情況的規則。Codex最佳化整個程式碼,讓每一個程式不擁腫,執行更快。導入可個人非商業使用的象棋引擎,做為大師級的挑戰。加上 AI 教練功能,讓電腦可以當下引導玩家做出更好的棋步選擇,並說明原因。Codex 要接手時,第一步我一樣讓他先去讀程式碼,以及前面我有持續維護更新的專案規則文件,掌握專案現況,接下來就可以更順利地推進工作。使用 Codex 開發功能的時候,我會使用規劃模式,讓 AI 先做出規劃,我確認後再執行,面對複雜改動時往往更有效。目前這個象棋遊戲,變成我和孩子週末練習時的一個有效輔助和遊戲。我們還是會拿出真的象棋來玩,但當想要挑戰一下,或是練習的時候,就打開這個象棋遊戲,用他的困難模式來訓練自己,或是父子一起挑戰大師模式,適時用電腦教學來看看什麼可能是更好的策略。在這次的經驗中,不只是開發程式,完成企劃、內容專案也一樣, AI 工具有不同特色,而不同 AI 之間能順利接手,關鍵在於「先把研究與規劃做紮實,再進入產出。」然後在不同 AI 工具切換時「把這個專案目前怎麼做才算好的規劃」一起交出去。 大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:不同 AI 工具如何分工、接力完成專案,分享我做一個象棋教學遊戲的流程)
電腦玩物 · 2026-03-25 20:41
怎麼讓 AI 從一次性的工具,變成能長期合作的工作夥伴?很多人以為 AI 用得好,關鍵在於 prompt 寫得夠完整、夠厲害;但是經過我這段時間反覆實測後慢慢確定,真正讓 AI 愈用愈準確、跨工具也能順利接手的關鍵,往往是有沒有把自己已經驗證有效的工作流程,整理成 AI 也看得懂、能遵守、能持續更新的規則系統。最近這幾個月,我開始養成一個習慣:把自己和 AI 合作後做得好的工作流程,慢慢寫成一份一份規則文件,讓 AI 助理能夠持續參考、反覆沿用。如果 workflow 還只存在你的腦中,只散落在片段聊天或零散 prompt 裡,那麼 AI 每一次都只能重新猜一次你的標準。可是當 workflow 被你整理進指令、文件、規則與復盤機制裡,它就不再只是一段聊天,而會慢慢變成一套可以持續運作的工作系統。Codex AI 助理上手教學:一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程延伸教學:AI 結合卡片盒筆記法,人不再操作軟體,用對話流程讓 Codex 搭建資料整理系統:我的兩個月實測心得一個很小的動作,改變了我後面一個月的 AI 工作流程先講一個真實案例。農曆年結束後,我在自己的 ChatGPT 裡做了一個很簡單的動作。這個動作不到一分鐘,但它對我接下來最近一個月的 ChatGPT 工作流程,帶來非常明顯的正向影響。因為我已經用 ChatGPT 好幾年了,加上前面幾年我自己一直有在實踐 PARA、專案分類、工作流程拆解這些方法,所以我知道自己在 ChatGPT 裡,其實已經留下了很多個不同專案、不同任務的工作經驗。(延伸閱讀:ChatGPT 的 PARA 聊天室分類法:增強 AI 協作威力實戰案例分享)於是那時候我做了一件事:我請 ChatGPT 回顧我不同專案討論串裡的聊天記錄,幫我整理這段時間以來,我聚焦在哪些主題的專案上,我在這些不同類型的專案裡慣用的分析邏輯是什麼,我最常執行的任務有哪些,而這些任務執行時常用的工作規則與操作步驟又是什麼。換句話說,我請 ChatGPT 透過它的整理能力、研究能力與記憶能力,先幫我把我原本就存在、但過去沒有明確寫出來的方法,梳理成一份我看得懂、也能驗證的工作原則。你是我的AI工作流程助手 根據我目前跟你討論的現況 擬出一份未來你作為AI助手處理工作的指導原則清單指南 請你一步步分析 首先你應該先去回顧最近我們最常討論的聊天紀錄 根據我們的聊天紀錄理解目前我最常進行的專案 並且設定出每個專案核心的知識背景 以及我們最常處理的任務和處理這些任務執行這些專案的關鍵步驟 執行原則 邏輯找出那些具有特殊性的地方 目的是未來你作為AI助手在執行這些工作的時候 有一份符合我們前面聊天紀錄處理事情方法的指南 最後從這些不同專案任務中再抽練出有沒有共通的 我們在執行工作的時候的指導原則 然後完成這份手冊的撰寫這整個過程其實非常快。AI 很快就幫我整理出一份從部落格、自媒體、課程、出版、親子、旅行、個人生活精進等不同角度出發的專案目標與工作流程摘要。然後我仔細看了一輪,發現它在一些共通原則、專案方向與工作步驟上的整理,都做得很好。也就是一份非常像「AI 工作流程助手指導原則手冊」的內容。例如,它幫我抽出了我最常使用的幾個共通原則,例如:第一,我做事情時,總是喜歡先定義要交付什麼成果,再開始分析。第二,我會先預擬這個成果的價值,再回頭拆解要達成這個價值,中間會遇到哪些問題與阻礙。第三,我會進一步把問題拆成現階段可以馬上推進的階段性產出,用「破解問題」的方式,讓目標做得更好、更有計畫。第四,我所有的建議最後都必須落到可執行的下一步,而不是停留在空泛理解。如果上過電腦玩物時間管理、筆記術或工作流程課程的朋友,看到這裡應該會很熟悉。這確實就是我長期在使用的方法。我把它用在很多真實的人生、工作與專案任務上:只是過去很多時候它是活在我的工作節奏裡,並沒有被完整寫成 AI 可以讀的規則。而當 AI 幫我把它梳理出來後,我接著做了下一步。從 ChatGPT prompt 到建立 ChatGPT 內的規則系統我把 AI 幫我整理出來的共通原則,放進 ChatGPT 的自訂指令裡。我也把它整理出來關於我的任務類型與工作脈絡,放進 ChatGPT 的「關於我」裡。接著,我本來就有用 ChatGPT 的專案功能做分類,像是出版計畫、自媒體寫作、親子規劃、個人生活精進等不同討論串,我就再把 AI 從這些討論串裡回顧出來的各自工作規則,放進相對應的專案指令中。效果非常快就出現了。接下來我進入「電腦玩物寫作專案」時,它會更自然地用符合我思考邏輯的方法幫我拆解題目、研究資料、設計文章架構。當我進入工作專案討論串,或詢問課程設計相關問題時,它也更能準確抓住我處理這類專案時的工作邏輯,再依照我的共通原則,給出更好的結果。這時候影響輸出品質的,已經不只是當下那一段指令,而是背後是否存在一套能長期指引 AI 的核心記憶、共通原則,以及面對不同任務時可以套用的工作規則。這也是我後來慢慢很在意的一件事:真正重要的,不是我當下臨時寫出一段多厲害的 prompt,而是我有沒有把那些已經做得好的工作方法,整理成一套 AI 也能穩定遵守的規則系統。覺得 ChatGPT 生成內容不穩定,先建立專屬於你的工作規則現在很多人都已經在用 ChatGPT、Gemini,或其他不同型態的 AI 助理工作。不過我觀察大家常遇到的問題其實很接近。每次問答似乎都從零開始。換一個 AI 工具,整個討論過程都要重來一次。很多人會覺得 AI 有時候回答很好,有時候又完全不像同一個助理。更常見的情況是,自己其實有一套做事方法,只是從來沒有被寫下來,所以 AI 永遠只能猜。從這個角度來看,問題不一定在於 AI 不夠強,而比較像是:我們以前沒有把自己做事的方法,整理成 AI 也能讀得懂的規則。所以如果你問我,想讓 AI 助理更懂你、更穩定、更能跨工具延續,第一步該做什麼,我會建議先做下面這幾個步驟。Step 1:先請 ChatGPT 回顧聊天與工作脈絡這一步,不是直接叫 AI「更懂我」,而是先讓它回顧你們近期真的做過的事。你可以請它幫你整理:你最近常處理哪些專案;你最常執行哪些任務;每個任務的關鍵步驟是什麼;這些步驟裡,有沒有反覆出現的共通原則。這其實很像一次工作回顧。先從已經發生的案例中,把你真正穩定在用的方法抽出來。很多人一開始就想直接寫一套完整 SOP 給 AI,可是大多數人其實很難憑空寫出來。真正比較可行的方法,是先回顧你們已經做過的事情,從那些有效的實例中,倒推出你真正慣用的方法論。Step 2:讓 AI 把共通原則抽煉出來當 AI 幫你回顧了一輪聊天、任務與專案後,接下來要做的事,就是把那些共通原則抽出來,寫成你之後可以持續沿用的「主規則」。以我自己的例子來說,我後來整理出的共通原則,大致會落在下面幾條:先定義要交付什麼成果,再開始分析。先拆問題,再給答案。先設定目標、現況、限制、成功條件,再拆步驟。所有建議都要能落地,並且有目前就能推進的下一步。把可重複的方法整理成可持久的手冊、清單、規則文件。這裡要特別強調的是,這些原則不是漂亮話,這些原則之所以有用,是因為它們真的是從你的工作節奏、思考方式、驗收標準中抽出來的。這些東西一旦被抽出來,AI 之後在不同任務裡,就會更容易抓到你真正重視的標準。Step 3:先放進 ChatGPT 的自訂指令與「關於我」這是規則化的第一層。對於大多數使用 ChatGPT 的使用者來說,簡單而有效。你可以先把兩類內容放進 ChatGPT 內部:第一類是「關於我」,讓 AI 了解你的身份、工作情境、讀者輪廓、常見任務與常處理的專案。第二類是「自訂指令」 中「應如何回應」的原則,讓 AI 了解你的流程偏好,例如先定義交付物、一步一步分析、重視可執行性、維持某種語氣與架構。這樣做的效果很實際:同一個 ChatGPT 會先變得穩定。你不需要每次重講一遍背景。AI 對你的工作風格,也會開始有比較一致的理解。如果你有在使用 ChatGPT 的專案功能,還可以進一步把不同任務類型的規則,放進不同專案裡。這樣一來,AI 不只是知道「你是誰」,它也知道你在不同任務裡,會用什麼方法工作。AI 做得好,是因為你把已驗證有效的 workflow 外顯成規則、記憶、驗收與回存機制。一般人也能透過讓 AI 「持續復盤」的方式建立規則,設計出你的 AI 助理:很多人聽到這裡,會以為自己接下來要先花很長時間,把所有規則一次寫完。其實不需要。我反而覺得,一般人最容易做得到的方法,是在一邊跟 AI 合作工作的過程中,一邊透過復盤,慢慢把有效流程整理成規則。例如你現在要規劃一場產品活動,你開始跟 AI 討論活動主題、研究案例、查詢市場資訊、整理論壇意見、設計行銷邏輯。剛開始時,AI 也許找資料不夠嚴謹,或者整理出來的內容沒有引用驗證。這時候你會追問、修正,告訴它之後找資料時要附上來源,要有找到的資料才能說出有根據的結論。經過一兩次追問修改後,你會發現它終於做到你要的要求了。這時候,很多人就直接把這個成果拿去用,然後下一次又從頭來過。但我後來發現,最重要的一步往往就在這裡:當 AI 做出有效結果後,你應該馬上請它做一次復盤,幫你把「剛才為什麼做得好」寫成一份之後可以套用的規則文件。例如你可以請它寫成一份「搜尋研究資料的工作規則」。之後當你們一起完成一份活動企劃案,也可以請它再寫成一份「有效活動企劃的工作流程規則」。當你們一起做出一份有效報告,則可以再整理成一份「處理有效報告的規則文件」。當你慢慢累積出這些規則文件之後,AI 在這個專案裡就會更懂得如何處理這些任務。如果你把它們放進自訂指令、專案設定,甚至更進一步放到其他工具的規則文件中,那它在不同討論串、不同專案,甚至不同 AI 工具之間,也會更懂得延續同一套做法。這個過程其實很像一個真實的人與人合作流程。你們不是一開始就有一本完整手冊,而是在持續磨合、討論、修正、完成有效成果之後,再透過復盤,把有效做法寫下來,之後反覆沿用。所以我現在會把這個流程看成一個很簡單、但很重要的循環:先跟 AI 一起完成一次任務。在過程中追問、修正、驗收。當結果開始有效時,馬上請 AI 復盤並整理成規則。把規則放進記憶、指令、專案文件。之後持續沿用,再根據新經驗微調。這種一邊做、一邊復盤、一邊建立規則的方式,對大多數工作者來說,比起一開始就硬寫完整規範,實際得多,也容易持續下去。當你開始切換多個不同 AI 工具,規則會變得更重要這件事,在我最近切換不同 AI 工具與助理時,感受特別強烈。因為現在可用的 AI 模型、AI 助理、AI 開發工具愈來愈多。有些工具比較強在聊天,有些比較強在操作處理專案文件,有些比較強在自動化流程,有些則適合當資訊入口。當我開始在 ChatGPT 之外,也用 OpenClaw、Codex、Google 的 Antigravity 等不同工具處理同一個專案時,我就發現:前面整理出來的那些原則、專案類型、工作流程規則文件,讓多個 AI 助理可以一起合作的價值立刻放大。例如前一陣子我在部署 OpenClaw 時做的第一件事,就是把我前面在 ChatGPT 用上述方法整理完成的原則、專案類型與工作流程規則文件,全部丟進 OpenClaw,讓它先讀過一遍。它讀完之後,很快就能建立或修改屬於它自己的記憶與 workflow 文件。這個過程其實不到兩三分鐘。但當我開始跟剛安裝完成的 OpenClaw 問答時,它就像一個我已經用好幾年的專案助理一樣,懂得我的工作狀態,知道我處理任務時重視的原則,也能用符合我工作邏輯的方式回答。後來我開始串聯 OpenClaw、Codex、ChatGPT、Gemini、Antigravity 這些不同工具來處理同一個專案時,這些規則文件就變得更重要。因為我不是只把程式碼、資料或聊天記錄搬過去,而是把「這個專案目前怎麼做才算好」的共同邏輯也一起搬過去。之前我在社群上分享過這段經驗:#我現在的分工,以及如何讓多個 AI 助理變成一個可以合作的團隊- OpenClaw:我用 Telegram 丟資料時最方便,主要負責「資訊入口+進行抓取與初步整理筆記卡片」- Codex 桌面端:在電腦端更舒服,他的運算能力也更強,主要負責「從既有永久筆記推進寫作/研究計畫」- ChatGPT / Gemini:補充零散的搜尋調查與快速問答討論- Antigravity(或其他本機工具):做 Markdown 編輯/瀏覽,或是系統維護但我覺得更關鍵的是:每一個助理可以同時進行我賦予的特別工作任務,但每一助理也都「可以」接手同一條完整的輸入到輸出草稿流程。因為它們共享的不是聊天紀錄,而是共享一套「外部共同記憶」:- 同一套資料夾結構- 同一套同步規則- 更重要的是,#同一套workflow的計畫與規則文件系統。這時候,建立 Agent / workflow / rules 相關文件確實是一個有效的方法。這些規則文件讓多個 AI 助理(Codex、 OpenClaw、 Antigravity,甚至 ChatGPT 我也把這些文件內容上傳讓他記住),讓我可以把同一個專案拆成「同時進行」的幾條線,但每個助理都了解工作方式,都可以處理各自任務。舉例來說:- 我從讓 OpenClaw 處理我剛丟進去的最新資訊來源 → 變成筆記卡 → 更新永久筆記- 同時間我讓 Codex 讀既有永久筆記 → 思考下一篇文章/研究計畫/大綱- 在前面兩個 AI 助理自動工作實,我用 ChatGPT/Gemini 做補充研究 → 把關鍵資料丟回同一個資料庫,進入處理的正向循環- 可是 OpenClaw、 Codex、 Antigravity 都會記住彼此做了什麼,可以隨時接續最新進度,展開下一步處理,維持共同邏輯。其實我用的方式非常簡單,就是這些 AI 助理與工具管理的是同一個資料庫。另外就是規則、Skills等等有分級,第一層資料夾是主規則,主規則會寫好邏輯,告訴AI針對每一個不同任務,到不同任務資料夾看資料,並使用不同任務資料夾裡的子規則。所以像是我告訴 AI 要抓取文章做筆記, AI 先看主規則,知道要去 raw 資料夾操作,進去後看到如何處理 raw 到筆記卡的規則,這時候遇到抓取 YouTube 字幕的問題,而 raw 裡的規則會引導 AI 去使用某個 Skills 或小工具。工作流程主從層次與分支清楚,就很好管理(而這可以請 AI 協助做編輯與分類)。最後整個資料庫會像「多個員工一起工作」一樣,整合建立一個完整的產出資料庫。一個更生活化的例子:家族旅行網站工具我最近有一個很生活化、也很能說明這件事的例子。我正在規劃一個很多人要一起出發的家族旅行。我想做一個網頁型的 App,把這次旅行的行程攻略、複雜的景點餐廳資訊、旅行中的注意事項、待辦清單與查詢功能整理在一起。讓每一位旅行成員打開後,都能快速查到某一天的行程、某一個地點的資訊,或行前、行中需要注意的事項。一開始,我先在 Google Gemini 上做出這個網頁工具的原型。可是 Gemini 畢竟比較適合處理較簡單的版本,當我想把這個網站做得更複雜,甚至要進一步線上部署時,我想要把它轉移到 Google 的 Antigravity。但在轉移之前,我並不是只把網站程式碼搬過去。我會先請 Gemini 根據我們前面設計這個網站原型時用到的工作邏輯,以及目前修改出來、已經有初步可用架構的網站狀態,先梳理成一份「專案目標+設計規則」文件。接下來,當我要把專案轉移到另外一個 AI 工具時,我會把程式碼、專案進度文件、設計規則文件一起搬過去,請新的 AI 先讀專案進度與設計規則,再去分析目前的程式碼,看下一步要怎麼改。後來到了下一個階段,Antigravity 的額度有限,而且當我要處理更複雜的特效與更繁瑣的資料庫邏輯時,它也不適合再負擔這樣的任務。我就把目前的資料庫狀態、程式碼與前面的規則文件、專案進度文件,再搬移到 ChatGPT 付費版可以使用的 Codex。同樣地,我會先請 Codex 讀專案進度與規則文件,再開始幫我修改程式碼。就在這樣的過程中,我發現每一次的轉移都很順暢。新的 AI 助理可以立即接手,我甚至可以同一時間讓不同 AI 工具分工處理同一個專案,或者在不同階段交棒,但整體邏輯都能延續。後來,當這個旅行網站工具進一步進入比較複雜的資料庫設計階段時,我又做了同樣的事。我希望未來無論我丟進去的是行程資訊、攻略資料、景點餐廳資料,還是真實旅遊心得,AI 都能有效幫我重新拆解、放回網站上正確的位置,讓整個資料庫維持穩定狀態。於是我請 Codex 先分析整個專案目前的資料庫架構,分析行程資訊通常放在哪裡、景點與餐廳資訊通常怎麼更新、攻略與注意事項通常怎麼描述,讓 AI 自主分析目前狀態與近期不斷修正之後的最佳工作流程,然後再建立一份新的規則文件。一旦這份規則文件建立好,我後面的工作流就變得更有效率。比如我今天找到一篇別人去同一個地方旅遊的真實心得,我就直接把這篇文章丟給 AI,請它根據前面自己整理出來的規則,把裡面的資訊重新拆解,分別放進適合的行程、景點、攻略、注意事項架構中。這時候 AI (這裡是用 Codex)就能非常準確地完成我的需求。小結:AI 真正會愈用愈好,靠的是規則化之後的工作方法很多人接觸 AI 之後,很容易立刻想追求「全自動」。可是我現在的想法剛好相反。我會建議先不要急著追求全自動。先追求一件更重要的事:AI 做事開始有一致標準。只要 AI 每次做同類型的工作,開始愈來愈接近你的驗收邏輯、愈來愈符合你的工作方式,後面才更容易談自動化、跨工具接手、多助理分工與更長的專案流程。說到底,這其實也很像以前我們人自己在做好一件事情時,會使用的時間管理與工作管理方法:事情做得好之後,不只完成它,還會做一次復盤,把「這次為什麼做好」整理成下一次可以沿用的做法。當人跟 AI 合作之後,我覺得這依然是很有效的方法,而且會愈來愈重要。你可以先挑一個自己最常做的 AI 任務,例如搜尋研究資料、整理會議紀錄、寫企劃、做簡報、整理逐字稿。接著利用前面「跟 AI 一起復盤前面做了什麼」的步驟,先把下面四種規則產出:這個任務的目標是什麼。這個任務的背景、情境與限制條件是什麼。這個任務有哪些要遵循的工作流程。做到什麼程度,才算完成(如何驗收)。跟 AI 一起把這個任務做一或幾次,在過程中持續修正、追問、驗收。等你們真的做出一版有效成果之後,記得馬上請 AI 幫你把這次的有效做法整理成規則。你可以直接用下面這段話:「請根據我們剛才從需求到產出的整個過程,整理出一份之後可以重複套用的工作規則。請包含:目標、適用情境、輸入資料、處理步驟、驗收標準、常見錯誤與下次執行提醒。」這樣做過幾次之後,你會很快發現,AI 不只是比較懂你,而是開始比較會做事。規則一旦慢慢累積起來,你會發現,無論你用的是 ChatGPT、Codex、OpenClaw,甚至未來換了新的 AI 工具,你的 AI 助理都比較有可能延續同一套工作邏輯,幫你把事情做得更準確、更穩定,也更接近你真正想要的成果。如果說這段實踐經驗給我的啟發,以及我現在必定會有的習慣就是:以後當 AI 幫我做出一個真的有效的成果時,我不應該只把成果拿走,而是要立刻請它幫我復盤:為什麼這次做得好?把它整理成下次可重複使用的規則。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:養成讓 AI 復盤工作流程的習慣,你的 ChatGPT、Codex、OpenClaw 助理就會愈做愈好)
電腦玩物 · 2026-03-15 18:03
這篇文章分享我這幾天對最新推出的 GPT-5.4 模型的一個工作流程實測案例,聚焦在幫助我們把一堆資料、數據、文件,變成「Excel 試算表+PPT 簡報+Word 講義」,且能產出正確、美觀、支援中文的 Office 文件檔案,看看 ChatGPT 5.4 Thinking 模型現在處理 Office 文件已經可以達到「更能滿足真實工作需求」的效果與品質。日常的辦公室工作中,往往會有下面的痛點:資料越查越多、文件越堆越厚,雖然筆記整理、企劃思考都有做到,但最後要:整理成一份 Excel 分類統計報告或是要製作會議中圖文並茂的 PPT 投影片還是要要產出一份可以印製出來的 Word 說明講義都要花費許多整理時間。但是現在如果讓 GPT-5.4 來做,已經可以在自動完成的 Office 文件中達到如下效果:表格欄位設計更合理。中文顯示更正確。PPT 簡報版面更多變化、AI 生成配圖更有效。Word 不再只是純文字稿,而是編輯排版後的表格。Excel 試算表可以處理多工作表的大量資料,並進行複雜欄位設計(包含合理的合併儲存格、基本統計分析等)。Codex AI 助理上手教學:一般人如何快速上手 Codex 超完整圖文教學:讓 AI 助理整理文件表格,建立自動化流程之前版本的 ChatGPT 也會做文件、試算表與簡報,但是常常失敗,早期是中文很容易錯亂或無法顯示,後來是雖然可以做,但內容缺乏太多變化,排版往往不夠好看,或是無法做複雜的整理分析,也可能做出來的內容無法下載、下載後打不開(我自己的真實經驗也都有遇過)。而這次 OpenAI 推出的 GPT-5.4,特別提到他強化了建立、編輯、排版 spreadsheets 試算表、presentations 簡報、documents 文件的能力:官方說明提到在內部 spreadsheet modeling benchmark 上,GPT-5.4 平均分數 87.3%,對比 GPT-5.2 的 68.4%,數據上有不少的提升。甚至在 GPT 製作簡報的評估上,人類評審有 68% 的時間偏好 GPT-5.4 產出的簡報,原因是:簡報的美感更好、視覺變化更多、圖像生成使用得更有效。產出 Office 文件不是 GPT-5.4 才有,但 GPT-5.4 官方說明是目前 OpenAI 官方最明確把「試算表、簡報、文件」當成核心提升方向,大幅強化這些 Office 排版編輯能力的版本,我的實際測試下,對中文知識工作者、辦公室工作者來說也很有效,所以寫成一篇文章跟大家分享。以 ChatGPT 的使用者角度來說,只要有 plus 以上的帳戶,就可以開啟 GPT-5.4 Thinking 模型,來處理複雜資料下產出 Excel、 PowerPoint、 Word 的工作流程。下面分享實測結果前,先列出 GPT-5.4 的幾個能力特性:GPT-5.4模型整合了推理、編碼以及處理試算表、文件和演示文稿等專業工作的進步。GPT-5.4解決「大海撈針」式問題方面表現更佳(尤其在搜尋大量網路資料時),並且聲稱比 GPT-5.2 的事實性錯誤減少了33%。GPT-5.4是OpenAI首個具備原生電腦使用能力的模型,這意味著它能夠代表用戶操作電腦並跨不同應用程式完成任務,是邁向AI代理人(agentic)未來的重要一步。GPT-5.4能編寫程式碼來操作電腦,並能根據截圖發出鍵盤和滑鼠指令;同時,它在使用網路瀏覽器以及更準確高效地調用工具和API方面也有所改進。專為ChatGPT推出的GPT-5.4 Thinking模型,能為複雜查詢提供工作大綱,並允許用戶在模型回應期間調整或修改請求,提升了用戶引導模型的效率。GPT-5.4模型正在ChatGPT、Codex和API中逐步推出,其中GPT-5.4 Thinking模型將面向Plus、Team和Pro用戶開放。Excel:把雜亂資料整理成多個工作表的「報告架構」+「案例數據資料庫」我在測試時,先讓 ChatGPT 5.4 Thinking 研究大量文件資料,我連結了自己雲端硬碟的真實文件、簡報,讓 GPT 先對資料進行梳理。我也在同一個討論串,讓 GPT-5.4 上網搜尋,在我的文件檔案之外,繼續獲取大量相關資料。在這一步,我發現 ChatGPT 5.4 Thinking 在網路搜尋的深度、廣度與資料抓取上,又比前一代模型有了更好的提升(實際數字上,新模型一次搜尋就有數百篇資料的搜尋量),搜得更廣、挖得更細。有了前面大量文件、網路資料的累積,這時候我模擬出一個「有很多雜亂資料」的討論串,接著開始測試處理成試算表的能力。我這樣對 ChatGPT 5.4 Thinking 下指令,然後 AI 跑了 18 分鐘完成一份非常詳盡的試算表:把前面雜亂的文件、網路資料,幫我整理成一份課程架構與案例試算表。請一步一步處理,主分頁整理核心課程架構,可以在其他分頁中加入前面討論研究過的對應案例,成為我課程中完整的資料分析結構。下圖是 ChatGPT 5.4 Thinking 做出的結果,雖然跑了很久(往往十幾分鐘起跳),試算表的成果品質非常好,可以納入完整的資料,建立的欄位表格都很正確。針對前面散亂的文件, GPT 5.4 正確找出資料的邏輯,做出有效的工作表分類、設計合理的欄位,並且把混亂的資料一一填在正確的位置。在排版設計上,也展現出符合工作要求的結果。PPT:從 Excel 骨架生成「一整天課程流程」與版面既然已經製作出試算表,我就接著讓 ChatGPT 5.4 Thinking 進一步設計簡報(還是要跑30分鐘左右):非常好的整理,現在幫我製作成 PPT 簡報版本,請一步一步處理,從前面的課程架構出發,結合你在試算表中整理好的案例、金句,串連起一整天課程完整的流程,讓每一個方法、金句、案例都有適當的順序,然後以你的簡報專業設計出最適合的版面,完成簡報的設計。現在的簡報版本可以看到,除了中文字都能正確顯示外, ChatGPT 5.4 Thinking 排版比起之前有更多的變化性,會自動用 AI 繪圖當作配圖,而且「大量的資料」才能順利整理成清楚、有架構、有細節的完整簡報內容,整體的風格也很適合工作簡報。延伸教學:Gemini AI 一鍵將 Google 文件製作成 Google 簡報,最簡單的教材轉投影片工作流程我的 Google AI 輔助簡報製作工作流程分享:從 NotebookLM 到 Google 簡報互補Word:總結「重點+練習」做成可印製的報告講義簡報製作完成後,我繼續讓 ChatGPT 5.4 Thinking 完成一份學員講義 word 文件的設計(也是需要十幾分鐘起跳的工作時間):把前面學員練習的內容與課程重點,整理成一份學員講義 word 文件,請一步一步處理。以前的 ChatGPT 製作 word ,除了中文容易出錯外,版面其實也是非常簡單的文字稿。但是 ChatGPT 5.4 Thinking 可以開始做「版面規劃與設計」,會自動畫出適合的表格、讓版面根據內容邏輯有更多變化,需要的大中小標、配色等等也都能自動完成。讓 GPT-5.4 Thinking 幫我們把知識工作、辦公室工作裡最麻煩的流程做出有效的草稿成果:先讓 AI 研究大量文件與網路資料 → 再把混亂資料整理成有架構的試算表 → 再從試算表長出一整天課程的簡報 → 最後再延伸成可印製的講義文件GPT-5.4 Thinking 現在不只是會做文件,而是也能接手“研究後整理成正式成果”的那段繁瑣工作。雖然,目前產出成果的等待時間有點長,但值得。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:用 GPT-5.4 Thinking 把雜亂資料變成精美 Excel、 PPT、 Word:一條龍 Office 工作流實測)
電腦玩物 · 2026-03-08 16:09
應該很多朋友跟我一樣,會利用 Google 的 NotebookLM 這個工具,來建立自己的學習資料庫、培養自己的學習助手。我在之前那篇「用 NotebookLM 實踐 AI 卡片盒筆記法:輸入、學習、輸出、復盤 6 步驟流程教學」文章中分享過:我如何在一個一個不同的 NotebookLM 裡面,打造個人不同主題的知識庫流程。而這樣累積出來的結果,最後幫我建立的不只是一個一個資料庫,而是訓練出我個人的「學習教練」:有一個是親子教養教練有一個是個人健康教練也可以有工作流程、寫作、專案管理的教練每個教練背後,都有我輸入的各種「覺得有價值、真的有幫助」的資料素材;我會透過跟每個教練討論,整理出這個主題的學習方法、我的個人目標、我的行動原則,重新匯入資料庫,訓練這個 AI 助理愈來愈符合我的需求。所以我可以在不同 NotebookLM 教練下面,提出各種生活與工作上遇到的問題。例如過完年之後體脂上升了,要怎麼解決?我就回到 NotebookLM 問一下我的個人健康教練,它會從之前學到的資料庫,並且透過我們討論過的「我的個人目標、行動原則」,幫我分析出過年後重新訓練體質的有效計畫。但 NotebookLM 最關鍵的瓶頸不是 AI,而是資料庫「還缺什麼」不過 NotebookLM 很關鍵的一點在於:資料本身的品質、深度、完整性。例如我有一個親子教養教練 NotebookLM,可是隨著小孩年紀不斷變化,可能我之前整理的「幼兒時期」資料,到了「小學階段」就需要補充新的材料。那怎麼辦?我這邊分享一個我常常使用的簡單有效技巧:讓 NotebookLM 在回答之後,順便告訴我:它覺得資料庫還缺什麼。我怎麼做:提問最後多加一句話,讓 AI 列出「資料庫缺口清單」當我在 NotebookLM 的資料庫詢問問題時,我常常會在問題指令的結尾,多加上一句:「最後你可不可以幫我列出:在解決這個問題的過程中,你發現資料庫中尚不足的資料?提供我未來輸入資料庫的建議。」這句話的效果是:NotebookLM 在「解題」的同時,也會幫我做一次「資料庫健檢」,然後提供我接下來找資料匯入的具體方向。真實案例:我問親子教練「8~9 歲陪伴策略」,它順便幫我指出還缺乏的資料這是我最近的一個真實應用案例。我來到 NotebookLM 裡建立的親子教養教練,問它:針對 8、9 歲小孩這個階段的陪伴策略我希望理解這個年紀孩子在「生理成長」上,科學研究已經發現哪些限制,避免我誤解孩子而我在問題的結尾,請它列出它在研究過程中發現「資料庫不足的資料」。於是它在回答最後跟我說:目前資料庫中確實大多是心理層面的材料但對於「生長階段/發展限制」這塊,確實可以強化它還很具體列出:可以去研究像皮亞傑、艾瑞克森這些不同年齡兒童心理與發展里程碑的方向。有了這麼具體的建議,我就可以直接複製它給我的關鍵字與研究方向,接著做下一步:讓 NotebookLM 用內建研究工具,把缺口補起來。下一步:用 Fast Research / Deep Research 補資料,讓教練越用越強我會進一步利用 NotebookLM 內建的研究功能,直接幫我上網找資料、分析研究,然後再把找到的結果匯入資料庫。Fast Research:快又精準、用來補「素材」Fast Research 的核心功能就是:透過 AI 分析研究,找到一些跟我的提問相關的文章,讓我更快把需要的素材匯入資料庫。Deep Research:更完整,直接產出「研究報告」用來補「結論」Deep Research 則更進一步:它會去找到更大量的文章,摘要整理研究這些文章,寫成一篇統整研究報告。Deep Research 我可以只匯入這份研究報告,讓資料庫:更精準有效,但又減少雜訊,不會太雜亂。我也可以連帶把研究報告背後的參考資料一起匯入資料庫,保留追溯來源的彈性。讓你的 NotebookLM 進入一個正向循環:越用越完整、越問越深入這樣一來,我的資料庫就能快速補足原本建立過程中還缺少的面向。最後會變成一個我很喜歡的循環:我在 NotebookLM 問問題AI 回答完,順便告訴我:資料庫缺什麼我用 Fast / Deep Research 補齊缺口我把新資料匯入資料庫下一次再問,答案更準、更貼近我需要的行動延伸技巧:我會「命令 AI 先整理」再回存,甚至刪掉雜訊很多朋友可能只是把資料匯入 NotebookLM 而已。但我自己非常在意:AI 工作流程不能有太多雜訊。所以我往往會透過提問,讓 AI 把雜亂資料整理成更有效的筆記,再把這些筆記匯回左邊的來源資料庫。當我擁有更精準的筆記之後,我甚至會把第一階段匯入的雜訊刪掉,想辦法讓左邊的資料庫保持最嚴謹、最精準有效的狀態。這樣 NotebookLM 教練就會提供更有效的回答。具體做法可參考:「用 NotebookLM 實踐 AI 卡片盒筆記法:輸入、學習、輸出、復盤 6 步驟流程教學」。上述實際使用經驗,提供給需要的朋友參考。大家好,我是電腦玩物站長 Esor ,歡迎參考我的系列課程與書籍:2026/1 最新著作上市,歡迎支持:《高效職場生存法圖解》大人學最新 AI 課程:用 AI 提升工作效率的實戰工作坊「個人數位生產力」線上課程(可使用電腦玩物老讀者折扣碼 ESOR500 ,獲得 500 元折價喔!)。時間管理、筆記系統、AI 工具相關課程:「課程介紹連結」著作:《防彈筆記法》訂閱追蹤 podcast 節目:「高效人生商學院」(Apple podcast 訂閱、 Google Podcast 訂閱)訂閱「電腦玩物電子報」,不定期出刊。我的電子郵件是 [email protected] ,如果你有任何關於筆記術、時間管理、提升工作效率的問題,歡迎寫信跟我討論。(歡迎社群分享。但全文轉載請來信詢問,禁止修改上述內文,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang 異塵行者,及附上原文連結:讓 NotebookLM 的 AI 自己找出資料庫缺口:每次指令多加一句追問,「教練型知識庫」越用越完整)
電腦玩物 · 2026-02-28 20:39