R18 內容提醒

做一個產品級的 NSFW ComfyUI 工作流要考慮什麼

這篇文章會分享到我參與的 Moshi Mosh AI 成人向 AI 圖片與影片生成功能開發心得。內容不涉及露骨描述，而是從接案、市場變化、模型測試、工作流設計與產品化角度，講述我做一個成人向 AI 產品生成工作流要考慮什麼。

注意：本文討論的是成人向 AI 生成技術、接案經驗與產品開發觀察。若你正在規劃相關產品，也應優先確認所在地法規、平台政策、付款服務條款、資料來源合法性、年齡驗證與內容安全機制。

最近這半年，很明顯可以感覺到 ComfyUI 工作流接案的需求和價碼都在下降。這不是單一工具突然失去價值，而是整個 AI 生成市場的基礎能力正在被大型平台快速吸收。

以前客戶想做圖片生成、修圖、風格轉換、圖片擴充、商品展示圖，常常會找人搭建一套專門的 ComfyUI Workflow。因為那時候主流平台的生成功能還沒有那麼完整，想要做到穩定、可控、批量化，確實需要懂 Stable Diffusion、節點流程、ControlNet、LoRA、提示詞和參數調整的人來處理。

但現在情況已經不同。ChatGPT、Gemini、Grok 等主流 AI 平台的生成功能愈來愈方便，一般網站如果只是需要基礎圖片生成、簡單修圖、換背景、換風格或圖片延伸，很多時候接一個 API 就能做出足夠可用的效果。

過去「會搭圖片生成工作流」是一種稀缺能力；但現在，單純幫客戶做出 AI 圖，已經越來越像平台內建功能，而不是高價值客製服務。

一、一般圖片生成工作流的商業價值下降？

在2025年，客戶可能會提出這樣的需求：想要生成 AI 模特兒穿著自家服裝的產品展示圖，想要把商品放進不同風格的場景，想要把一張人物照轉成某種插畫風格，或是把原本不完整的圖片往外擴充。這些需求在當時看起來很適合用 ComfyUI 做客製化流程，因為可以把模型、提示詞、節點和後處理串成一條穩定的流程。

但在2026年，主流平台把這些能力做得越來越簡單，客戶的選擇也會改變。如果一個網站只需要「大致可用」的圖片生成效果，那它未必願意花更高成本請人搭建私有工作流。對客戶來說，API 方案的優勢很明顯：不用維護模型、不用處理顯卡、不用管理工作流、不用研究參數，只要把功能接進產品裡就好。

另一個變化是，AI 生成內容的主場正在從圖片，慢慢往更高品質的影片生成移動。當大家開始關注更流暢、更穩定、更可商用的影片模型時，簡單的圖片或影片工作流的吸引力自然會下降。它不再是最有想像空間的地方。

如果一項能力已經被主流平台做成標準功能，接案人就很難只靠「我可以做出這個效果」來維持高價值。下一波真正有價值的會轉移到更複雜、更垂直、更需要產品判斷的場景。

二、成人向 AI 生成

有一個領域，目前主流平台仍然很難完全取代，那就是成人向 NSFW 生成。

主流 AI 公司通常不希望自己的產品被定位成成人內容生成器。原因不只是道德判斷，也包含非常現實的商業與合規壓力，例如金流風險、品牌安全、App Store 與 Google Play 規範、平台政策、監管壓力、合作夥伴疑慮，以及內容濫用風險。

所以在成人向文字生成、圖片生成、影片生成這些方向上，很多產品仍然需要依賴開源模型、私有部署、自建工作流和更細緻的內容控管。這也是為什麼當一般生圖工作流的價值下降時，成人向、角色互動、私有化部署、特定風格生成、內容安全分流等垂直需求，反而還有一定的技術門檻。

我今年參與了 Moshi Mosh AI 的成人向圖片和影片 AI 生成功能開發。這是我第一次接觸成人向 AI 案子，做完感覺自己對 AI 行業的理解又深入了一層。

因為產品類案子不是單純追求「一次的結果」可用。它真正困難的地方，在於要讓生成能力變成可以被使用者反覆操作的產品功能。

三、成人向生成和一般圖片生成案有什麼不同？

一般圖片生成案比較常處理的是美感、風格一致性、角色一致性、產品展示、構圖、光影、材質、背景替換和品牌調性。這些已經不容易，但它們大多仍然圍繞「畫面品質」展開。

成人向生成除了畫面品質以外，還會多出一個很大的難題：動作理解。

尤其是 AI 成人影片生成，並不是寫一段提示詞叫模型生成影片就可以。影片模型需要理解人物姿勢、鏡頭角度、肢體方向、畫面連續性和動作節奏。如果模型對動作的理解不穩，畫面就很容易出現變形、動作不連貫、角色崩壞或前後幀不一致的問題。

1. 需要理解成人向領域的專用描述

做這類產品時，首先要理解成人向內容中常見的分類、姿勢描述和動作表達方式。這並不是為了追求露骨，而是因為模型需要更精確的描述，才能生成比較穩定的結果。

如果提示詞太模糊，模型會自行補完畫面；而模型補完的結果不一定符合使用者期待，也不一定穩定。反過來說，如果提示詞能清楚描述人物位置、鏡頭角度、動作方向、畫面風格和輸出限制，生成結果就比較容易接近產品需要的品質。

2. 圖片到影片非常依賴第一幀

圖片生影片模型很依賴第一幀圖片。第一幀是整段影片的基礎。人物姿勢、鏡頭位置、角色比例、畫面構圖和視覺風格，都會影響後續影片的穩定度。

如果第一幀的姿勢和影片提示詞想要的動作方向不一致，生成結果就很容易崩壞。例如第一幀人物的角度、位置或肢體方向，和提示詞要求的動作邏輯彼此衝突，模型就會在生成過程中嘗試硬轉換畫面，最後造成角色變形或動作不自然。

所以這類工作流不能只看單張圖片漂亮不漂亮，而是要同時考慮：這張圖能不能成為影片生成的穩定起點？它和後續動作提示詞能不能自然銜接？它是否保留足夠的空間讓模型延展動作？

3. 不能只靠一兩個 Demo 結果驗收

產品級的難度在於，使用者會輸入各種不同文字。有些人寫得很清楚，有些人寫得很模糊；有些人用完整句子，有些人只打幾個關鍵字；有些人用中文，有些人用英文，也可能有人混用口語、縮寫或不同語言。

如果工作流只能在一兩個精心設計的 prompt 下產生好結果，那它其實還不能算產品功能。真正的產品功能必須能承受大量不穩定輸入，並且在不同情境下仍然維持可接受的生成品質。

四、技術挑戰

這次案子最後花了大約三個月，主要工作包括資料搜尋、模型測試、LoRA 測試、提示詞格式測試、參數調整和工作流改版。過程中一直在反覆確認幾個問題。

這個模型能做出符合案主需求的日本AV寫實風格嗎?
這個模型對成人向動作的理解能力好不好？
這個 LoRA 會不會影響角色一致性或畫面穩定度？
這種提示詞格式會不會讓模型更容易理解動作？
同一套流程能不能承受不同使用者的輸入方式？
圖片到影片的連貫性是否自然？
寫實風格和動漫風格要如何處理，在一套工作流裡能通用？

1. 不同動作需求需要不同 LoRA 與流程

在一般圖片生成裡，LoRA 常被用來控制角色、畫風、服裝或特定視覺特徵。但在成人向生成裡，也可以使用 LoRA 來增強動作理解、姿勢穩定度和畫面結構。

不同動作需求不一定適合同一個 LoRA。某些 LoRA 對特定姿勢比較穩，換成另一種動作就可能讓角色比例或構圖變差。這代表工作流不能只是把所有模型和 LoRA 固定串起來，而是要根據使用者需求切換不同組合。

這也是產品化和 Demo 最大的差別。Demo 可以抽卡挑一個最容易成功的案例展示；產品則要面對各種輸入、各種需求和各種邊界情況。

2. 寫實風格和動漫風格不能共用同一套 prompt

案主希望同時支援像日本AV的寫實風格和動漫風格，這件事又增加了一層複雜度。

最後測試效果比較好的兩套模型，在提示詞格式上其實有不同要求。寫實模型比較吃某些具體、攝影式、材質與鏡頭導向的描述；動漫模型則比較適合另一套更偏角色標籤、畫風標籤和構圖標籤的描述方式。

也就是說，不能用同一套 prompt 格式硬套全部模型。表面上都是「生成成人向圖片或影片」，但模型本身的訓練資料、理解方式和輸入習慣不同，工作流就必須跟著調整。

3. 使用者輸入需要被整理，而不是原封不動丟給模型

很多人以為 AI 生成產品只是把使用者輸入送進模型，然後把結果吐出來。但實際上，產品級生成通常需要一層輸入整理機制。

使用者輸入可能太短、太模糊、語言混雜，或缺少模型需要的關鍵資訊。這時候工作流需要把輸入轉換成更穩定的格式，例如補上風格、鏡頭、角色狀態、輸出限制、負面提示詞，甚至依照不同模型改寫成不同 prompt 結構。

這個步驟很像把自然語言翻譯成模型能理解的產品指令。做得好，使用者會覺得產品很聰明；做不好，使用者會覺得生成結果很隨機。

經驗總論

這次讓我更確定一件事：AI 生成行業的變化真的很快。以前需要專人搭建的流程，可能很快被 API 或主流工具簡化。這不是壞事，而是代表市場正在成熟。當基礎能力變便宜，真正的價值就會往更難標準化的地方移動。

未來更有價值的地方，會是怎樣把模型變成產品，怎樣處理大量不穩定的使用者輸入，怎樣在不同模型、LoRA、提示詞和生成流程之間自動切換，怎樣讓生成結果穩定到可以商業化。

對 ComfyUI、開源模型和私有部署來說，它們並沒有失去位置，只是位置改變了。它更適合用在複雜、垂直、需要可控性、需要私有化、需要多模型整合的產品場景。

成人向 AI 生成就是其中一個例子。因為主流平台不一定願意做，客戶又確實有需求，所以開源模型、自建工作流和客製化產品開發仍然有空間。但這個空間需要的不只是技術執行，而是更完整的產品思維。

2026年的AI生成接案人的定位不能只停留在「幫人做 Workflow」。如果只是會把節點接起來，市場遲早會把這件事壓到很低價。真正有競爭力的，是能理解產品需求、使用者行為和生成穩定性的人。

我認為未來比較有價值的能力包括：

理解不同模型的優勢、限制與適用場景。
能根據使用者輸入做 prompt 改寫、分類與路由。
能設計模型、LoRA、參數與後處理的自動切換流程。
能用產品角度測試生成穩定度。

最後感謝你把我的文章看完，附上一張清涼圖給大家養眼睛～

這個 NSFW 生成工具在 Moshi Mosh AI 已經推出了，歡迎大家去玩玩看 (第2個 Mosh 沒有 I)

EC學習筆記

2026/07/05

[R18]成人向AI生成接案分享

做一個產品級的 NSFW ComfyUI 工作流要考慮什麼

一、一般圖片生成工作流的商業價值下降？

二、成人向 AI 生成

三、成人向生成和一般圖片生成案有什麼不同？

1. 需要理解成人向領域的專用描述

2. 圖片到影片非常依賴第一幀

3. 不能只靠一兩個 Demo 結果驗收

四、技術挑戰

1. 不同動作需求需要不同 LoRA 與流程

2. 寫實風格和動漫風格不能共用同一套 prompt

3. 使用者輸入需要被整理，而不是原封不動丟給模型

經驗總論