Agent Skills

pdfvision 在 skills/pdfvision/ 中包含 Agent Skills。它們告訴代理何時呼叫 CLI、先嘗試哪些參數，以及何時升級到版面、渲染、OCR 或視覺區域裁切。

PDF 工作很少能用一個固定命令解決。一個有用的代理應檢查第一輪結果，發現缺失或可疑證據，並選擇下一次 pdfvision pass。內建 Agent Skills 編碼了這個 workflow，使每個代理工作階段不必重新發現它。

安裝

bash

npx skills add yamadashy/pdfvision

全域安裝：

bash

npx skills add yamadashy/pdfvision -g

Agent Skills 的主指令刻意保持簡短，只在任務需要時指向 references。

支援 Agent Skills 的代理通常應該：

這能保持互動高效，同時仍讓代理有機會像人類讀者一樣查看 PDF。

在代理經常讀取 PDF、報告、投影片、表單或掃描文件的專案中安裝 Agent Skills。已經使用 Claude Code、Codex、Cursor 或其他支援 Agent Skills 的代理環境的 repository 尤其適合。