AI Image Prompts: Hướng Dẫn Kỹ Thuật Viết Hoàn Chỉnh 2026 | Apatero Blog - Open Source AI & Programming Tutorials
/ Tutorials / AI Image Prompts: Hướng Dẫn Kỹ Thuật Viết Prompt Hoàn Chỉnh Để Có Kết Quả Tuyệt Vời
Tutorials 41 phút đọc

AI Image Prompts: Hướng Dẫn Kỹ Thuật Viết Prompt Hoàn Chỉnh Để Có Kết Quả Tuyệt Vời

Nắm vững AI image prompts với các công thức đã được chứng minh, ví dụ thực tế và kỹ thuật biến ý tưởng mơ hồ thành hình ảnh chuyên nghiệp. Bao gồm so sánh trước/sau.

Khái niệm kỹ thuật viết AI image prompt cho thấy văn bản được chuyển đổi thành các tác phẩm AI tuyệt vời

Tôi đã dành ba tháng đầu tiên trong hành trình tạo hình ảnh AI của mình viết những prompt tồi tệ. Không phải vì thiếu sáng tạo, mà vì chưa ai dạy tôi cơ chế thực sự của cách các mô hình diễn giải ngôn ngữ. Tôi sẽ gõ something like "cool dragon" và tự hỏi tại sao kết quả lại trông như một bìa cuốn tiểu thuyết kỳ ảo bị từ chối từ năm 1987. Điểm ngoặt đến khi tôi bắt đầu coi prompt như các công thức nấu ăn thay vì những điều ước.

Sau khi tạo ra hơn 60,000 hình ảnh trên Stable Diffusion, Midjourney, Flux và một nửa chục mô hình khác, tôi có thể nói với sự tự tin: ai image prompts là 80% của phương trình. Mô hình bạn chọn, các cài đặt bạn điều chỉnh, phần cứng bạn chạy, tất cả đều quan trọng. Nhưng prompt là cái tách biệt một hình ảnh dễ quên với một hình ảnh làm cho mọi người ngừng cuộn.

Câu trả lời nhanh: Các AI image prompts tuyệt vời tuân theo một cấu trúc nhất quán. Bắt đầu bằng phương tiện và phong cách, mô tả chủ thể của bạn với độ chính xác, xác định bố cục và ánh sáng, và thêm các thuật ngữ chất lượng kỹ thuật. Một prompt mạnh đọc giống như một bản sơ yếu lý lịch sáng tạo cho nhiếp ảnh gia hoặc họa sĩ, không phải như một chú thích bạn sẽ đặt dưới một bức ảnh. Công thức là: [Medium/Style] + [Subject with details] + [Environment/Setting] + [Lighting/Mood] + [Technical/Quality terms]. Nắm vững công thức này và bạn sẽ tạo ra hình ảnh chất lượng chuyên nghiệp ở lần thứ nhất hoặc thứ hai thay vì lần thứ mười lăm.

Những Điểm Chính:
  • Cấu trúc prompt quan trọng hơn độ dài prompt. Một prompt tập trung 30 từ vượt trội hơn một prompt lằng nhằng 100 từ
  • Mọi mô hình AI diễn giải prompt khác nhau. Midjourney ưa thích cảm giác, Stable Diffusion thưởng chính xác, Flux phản ứng với ngôn ngữ tự nhiên
  • Negative prompts cũng quan trọng như positive prompts cho quy trình Stable Diffusion
  • Các kỹ sư prompt tốt nhất lặp đi lặp lại. Mong đợi tinh chỉnh 3-5 lần trước khi hạ cánh hình ảnh cuối cùng
  • Thứ tự từ trong prompt của bạn ảnh hưởng đến nhấn mạnh. Các thuật ngữ được tải lên phía trước mang trọng lượng lớn hơn trong hầu hết các mô hình
  • Học prompt engineering là kỹ năng ROI cao nhất duy nhất trong tạo hình ảnh AI

Tại Sao AI Image Prompts Của Bạn Không Hoạt Động

Hầu hết mọi người tiếp cận tạo hình ảnh AI theo cách họ tiếp cận tìm kiếm Google. Họ gõ một vài từ, nhấn enter, và hy vọng tốt nhất. Cách tiếp cận đó có thể tìm thấy một kết quả web đứng đầu, nhưng nó tạo ra những hình ảnh khủng khiếp. Lý do là các mô hình tạo hình ảnh AI không phải là công cụ tìm kiếm. Chúng là các hệ thống sinh tạo xây dựng hình ảnh từ đầu dựa trên các hướng dẫn văn bản của bạn, và chúng cần độ cụ thể để làm điều đó tốt.

Tôi nhớ chính xác thời điểm này nhấp vào. Tôi đang cố gắng tạo một chân dung cho tiêu đề blog và gõ "professional headshot of a woman." Kết quả là một khuôn mặt bằng, được căn giữa, với ánh sáng phẳng và không có cá tính. Sau đó, tôi viết lại nó thành "editorial portrait of a confident businesswoman in her 40s, warm side lighting from a large window, shallow depth of field, earth-toned blazer, genuine smile, shot on Canon EOS R5 with 85mm f/1.4 lens, soft bokeh background of a modern office." Khác biệt như ngày và đêm. Cùng một mô hình, cùng một cài đặt, kết quả hoàn toàn khác nhau.

Bài học này là: Các prompt mơ hồ tạo ra những hình ảnh chung chung. Các prompt cụ thể tạo ra những hình ảnh có tính cách và ý định.

Dưới đây là ba sai lầm phổ biến nhất tôi thấy mọi người mắc phải với các AI image prompts của họ.

Sai lầm 1: Quá trừu tượng. "A beautiful landscape" cung cấp cho mô hình hầu như không có gì để làm việc. Đẹp thế nào? Loại cảnh nào? Thời gian nào trong ngày? Mùa nào? Tâm trạng nào? Mô hình phải lấp đầy mọi khoảng trống bằng dữ liệu đào tạo trung bình, và các trung bình là nhàm chán theo định nghĩa.

Sai lầm 2: Bỏ qua bố cục. Bạn có thể mô tả chủ thể hoàn hảo nhưng không nói gì về khung hình, góc độ hoặc các mối quan hệ không gian. Kết quả là một chủ thể được mô tả kỹ thuật nổi trong một sắp xếp ngẫu nhiên. Thêm các thuật ngữ như "close-up," "bird's eye view," "rule of thirds composition," hoặc "leading lines" sẽ cải thiện đáng kể chất lượng đầu ra.

Sai lầm 3: Quên lớp kỹ thuật. Các nhiếp ảnh gia chuyên nghiệp suy nghĩ về sự lựa chọn ống kính, khẩu độ, phim quay và hậu xử lý. Các mô hình được đào tạo trên dữ liệu ảnh được chú thích đáp ứng với các thuật ngữ tương tự. Thêm "shot on Hasselblad," "Kodak Portra 400," hoặc "f/2.8 bokeh" không chỉ thêm siêu dữ liệu. Nó thực sự thay đổi phong cách hình ảnh theo hướng những hình ảnh được liên kết với thiết bị và kỹ thuật đó.

Công Thức Prompt Đã Thay Đổi Mọi Thứ

Sau nhiều tháng thử nghiệm và lỗi trên các mô hình khác nhau, tôi đã phát triển một công thức hoạt động một cách đáng tin cậy trên Stable Diffusion, Midjourney, Flux và hầu hết các trình tạo hiện đại khác. Tôi sử dụng cách này trên Apatero cho phần lớn công việc chuyên nghiệp của tôi, và nó liên tục cung cấp kết quả yêu cầu lặp lại tối thiểu.

Dưới đây là công thức được phân tích thành các lớp.

Lớp 1: Phương Tiện và Phong Cách (Loại hình ảnh này là gì?)

Đây là tuyên bố mở đầu của bạn. Nó cho mô hình biết vũ trụ nghệ thuật nào để hoạt động trước khi nó xử lý bất cứ điều gì khác. Vì hầu hết các mô hình cân nặng các token sớm hơn, lớp này đặt nền tảng cho mọi thứ theo sau.

Ví dụ về những người mở cửa mạnh mẽ:

  • Oil painting in the style of the Dutch Golden Age
  • Cinematic film still, anamorphic lens
  • Professional food photography, magazine quality
  • Isometric 3D render, clean minimal style
  • Watercolor illustration, loose brushwork
  • Photorealistic digital art, hyperdetailed

Lớp 2: Chủ Thể Có Chi Tiết (Điều Này Là Về Ai Hoặc Cái Gì?)

Đây là nơi hầu hết mọi người dừng lại, nhưng nó nên chỉ là sự khởi đầu. Đừng chỉ đặt tên cho chủ thể. Mô tả nó với đủ chi tiết để một nghệ sĩ con người có thể phác họa mà không cần đặt câu hỏi tiếp theo.

Xấu: a cat

Tốt: a fluffy orange tabby cat with bright green eyes, sitting upright on a vintage leather armchair, one paw draped over the armrest, looking directly at the camera with a slightly regal expression

Lưu ý cách phiên bản tốt bao gồm loài, màu sắc, đặc điểm giống, màu mắt, tư thế, vị trí, tương tác phụ, hướng nhìn và tính cách. Mỗi chi tiết đó hạn chế không gian đầu ra của mô hình và đẩy nó hướng tới một hình ảnh cụ thể, thú vị thay vì một hình ảnh chung chung.

Lớp 3: Môi Trường và Cài Đặt (Điều Này Đang Xảy Ra Ở Đâu?)

Nền không phải là một ý nghĩ sau. Nó thiết lập bối cảnh, tâm trạng và độ sâu hình ảnh. Ngay cả đối với chân dung, môi trường cũng mang trọng lượng đáng kể. Tôi đã viết về điều này chi tiết hơn trong hướng dẫn của tôi về creating AI images like a professional.

Xấu: in a room

Tốt: inside a sunlit Parisian apartment, tall windows with sheer white curtains, aged hardwood floors, a vase of wilting sunflowers on a side table, afternoon light casting long shadows

Lớp 4: Ánh Sáng và Tâm Trạng (Cảm Giác Này Như Thế Nào?)

Ánh sáng là anh hùng được xem thường của kỹ thuật viết prompt cho hình ảnh. Các nhiếp ảnh gia chuyên nghiệp suy nghĩ về ánh sáng vì lý do chính đáng. Nó biến đổi các chủ thể giống hệt nhau thành những trải nghiệm cảm xúc hoàn toàn khác nhau. Cô gái tương tự với cùng một chiếc váy trông lộng lẫy dưới ánh sáng chiều lưng ấm áp và buồn bã dưới ánh sáng huỳnh quang trên cao khắc nghiệt.

Các thuật ngữ ánh sáng mạnh để ghi nhớ:

  • Golden hour, warm backlight (romantic, warm)
  • Dramatic chiaroscuro, deep shadows (intense, cinematic)
  • Soft diffused overcast light (gentle, editorial)
  • Neon-lit, cyberpunk atmosphere (futuristic, energetic)
  • Studio Rembrandt lighting, single key light (classic portrait)
  • Volumetric fog, god rays through windows (atmospheric, ethereal)

Lớp 5: Công Cụ Kỹ Thuật và Chất Lượng (Làm Cho Nó Trông Bóng Bẩy)

Lớp cuối cùng này là lớp hoàn thiện của bạn. Các thuật ngữ này đẩy đầu ra hướng tới chất lượng hình ảnh cao hơn và thẩm mỹ tinh tế hơn. Hãy coi chúng như các hướng dẫn hậu xử lý được nướng vào prompt.

Công cụ tăng chất lượng đáng tin cậy tôi sử dụng thường xuyên:

  • 8K resolution, highly detailed
  • Shot on Hasselblad X2D or shot on Sony A7R V
  • 85mm portrait lens, f/1.4
  • Award-winning photography
  • Trending on ArtStation (for digital art styles)
  • Masterpiece, best quality (especially effective in anime-trained models)

Công Thức Hoàn Chỉnh Trong Hành Động

Hãy để tôi đặt tất cả năm lớp lại với nhau với một so sánh trước và sau.

Trước (prompt điển hình): a wizard in a forest

Sau (công thức được áp dụng): Digital fantasy painting, highly detailed. A weathered elderly wizard with a long silver beard and deep-set blue eyes, wearing layered robes of midnight blue and dark green, holding a gnarled oak staff topped with a faintly glowing amber crystal. Standing at the edge of an ancient forest, massive moss-covered trees with twisted roots, soft mist rolling between the trunks, bioluminescent mushrooms dotting the forest floor. Golden hour light filtering through the canopy, volumetric light rays, warm highlights on the wizard's face contrasting with cool forest shadows. 8K, intricate detail, fantasy art, trending on ArtStation

Prompt thứ hai không chỉ dài hơn. Mỗi từ đang làm việc cụ thể. Không có chất độn, không có sự lặp lại, chỉ chi tiết xếp lớp cung cấp cho mô hình một bản sơ yếu lý lịch sáng tạo toàn diện.

Các AI Image Prompts Tốt Nhất Cho Mỗi Phong Cách

Một điều tôi đã học được từ việc chạy hàng nghìn thế hệ qua Apatero là các phong cách hình ảnh khác nhau yêu cầu các chiến lược nhắc khác nhau. Những gì hoạt động cho chân dung chân thực sẽ thất bại cho minh họa anime, và ngược lại. Dưới đây là các AI image prompts tốt nhất tôi đã tinh chỉnh cho các phong cách phổ biến nhất, cùng với lý do đằng sau mỗi lựa chọn.

Chân Dung Chân Thực

Chủ nghĩa hiện thực ảnh là nơi các thuật ngữ máy ảnh kỹ thuật tỏa sáng. Mô hình đã thấy hàng triệu bức ảnh được chú thích, vì vậy việc nói ngôn ngữ của nhiếp ảnh sẽ kích hoạt đường dẫn thần kinh phù hợp.

Ví dụ prompt: Editorial portrait photograph of a man in his late 30s with short dark hair and a neatly trimmed beard, wearing a charcoal wool turtleneck sweater. Shot in a naturally lit coffee shop, warm ambient light from large storefront windows, shallow depth of field with soft bokeh of blurred patrons and warm lights in background. Captured on Canon EOS R5 with RF 85mm f/1.2 L lens, natural skin texture, subtle film grain, color graded with warm tones, professional retouching

Tại sao nó hoạt động: Tên thân xác máy ảnh, giá trị khẩu độ và các thuật ngữ hậu xử lý đều đẩy mô hình theo hướng dữ liệu đào tạo chụp ảnh. Các chi tiết môi trường tạo bối cảnh tin cậy.

Anime và Manga

Các mô hình anime phản ứng với một từ vựng hoàn toàn khác. Các thuật ngữ như "masterpiece" và "best quality" thực tế cần thiết cho các trình tạo anime dựa trên điểm kiểm tra, và các quy ước mô tả nhân vật khác với các prompt thực tế.

Ví dụ prompt: masterpiece, best quality, 1girl, long flowing silver hair, crimson eyes, detailed face, gentle expression, wearing a dark academia uniform with gold trim, standing in a vast library with towering bookshelves, warm lamplight, dust particles floating in light beams, dynamic angle from below, detailed hands, intricate clothing folds, studio ghibli color palette, soft cel shading

Tại sao nó hoạt động: Các mô hình anime được đào tạo trên các tập dữ liệu được gắn thẻ (như Danbooru) sử dụng các mô tả phân tách bằng dấu phẩy thay vì câu tự nhiên. Các thuật ngữ như "1girl" và "detailed face" là một phần của quy ước gắn thẻ này.

Concept Art và Fantasy

Đối với concept art, bạn muốn kêu gọi ngôn ngữ của các nghệ sĩ concept chuyên nghiệp và giám đốc sáng tạo. Các prompt này được hưởng lợi từ việc tham khảo các nghệ sĩ cụ thể, phong trào nghệ thuật hoặc phong cách hình ảnh được thiết lập.

Ví dụ prompt: Epic fantasy concept art, a colossal ancient dragon perched atop a crumbling gothic cathedral, massive wingspan spread against a turbulent storm sky, lightning illuminating its obsidian scales, the ruined city below shrouded in smoke and ash, tiny silhouettes of fleeing villagers for scale, matte painting style, cinematic composition, detailed environment design, dark atmosphere with warm fire accents, inspired by the visual language of classic fantasy illustration, 4K, environment concept art

Tại sao nó hoạt động: Tham chiếu quy mô ("tiny silhouettes for scale"), thuật ngữ ngành công nghiệp ("matte painting style," "environment concept art") và chi tiết khí quyển tạo đầu ra kịch tính, chi tiết mà concept art yêu cầu.

Chụp Ảnh Sản Phẩm

Đây là một khu vực mà kỹ thuật viết prompt thực sự thay thế các bức ảnh studio đắt tiền cho nhiều trường hợp sử dụng. Tôi bắt đầu sử dụng các bức ảnh sản phẩm được tạo AI cho các mockup khoảng một năm trước và bất ngờ về tốc độ mà chất lượng trở nên sẵn sàng cho sản xuất.

Ví dụ prompt: Professional product photography, luxury perfume bottle with amber liquid, geometric crystal-cut glass design, sitting on a polished black marble surface. Single product hero shot, soft studio lighting with one large softbox at 45 degrees, subtle reflection on marble, clean white background transitioning to soft gray gradient, no text, no labels. Shot with a medium format camera, 100mm macro lens, f/8, focus stacked for complete sharpness, commercial advertising quality

Tại sao nó hoạt động: Chụp ảnh sản phẩm có các quy ước nghiêm ngặt (nền sạch, ánh sáng được kiểm soát, tiêu điểm sắc nét) và sử dụng các thuật ngữ từ kỷ luật đó hướng dẫn mô hình chính xác.

Cách Viết AI Image Prompts Cho Stable Diffusion

Stable Diffusion xứng đáng có phần của riêng nó vì nó xử lý prompt khác với các dịch vụ dựa trên API như Midjourney. Nếu bạn đang chạy ComfyUI hoặc Automatic1111, bạn có quyền truy cập vào trọng số prompt, negative prompts và các tính năng cú pháp khác mở rộng đáng kể kiểm soát của bạn. Tôi đã đề cập đến quy trình rộng hơn trong phần của tôi trên text-to-image AI generation, nhưng ở đây tôi muốn tập trung cụ thể vào phía viết prompt.

Trọng Số Prompt

Stable Diffusion cho phép bạn nhấn mạnh hoặc hạ nhẹ các thuật ngữ cụ thể bằng cách sử dụng dấu ngoặc đơn và trọng lượng số. Đây là một công cụ không thể tin được được khi bạn hiểu nó.

  • (word:1.3) tăng nhấn mạnh 30%
  • (word:0.7) giảm nhấn mạnh 30%
  • ((word)) là viết tắt gần đúng 1.21x nhấn mạnh
  • (((word))) là viết tắt gần đúng 1.33x nhấn mạnh

Ví dụ thực tế: A portrait of a woman, (freckles:1.4), (red curly hair:1.2), green eyes, wearing a (vintage floral dress:0.9), standing in a sunlit meadow

Trong prompt này, tàn nhang được nhấn mạnh mạnh mẽ để chúng xuất hiện nổi bật, tóc đỏ xoăn được nhấn mạnh vừa phải, và váy hoa cổ điển được hạ nhẹ để nó không thống trị thành phần. Loại kiểm soát chi tiết này là cái gì bạn không thể nhận được với Midjourney hoặc DALL-E.

Từ Khóa BREAK

Khi prompt của bạn dài, Stable Diffusion xử lý nó trong các khối 77 token. Từ khóa BREAK buộc một ranh giới khối mới, có thể giúp khi các chi tiết quan trọng ở cuối một prompt dài bị bỏ qua.

Quy Trình ComfyUI Miễn Phí

Tìm quy trình ComfyUI miễn phí và mã nguồn mở cho các kỹ thuật trong bài viết này. Mã nguồn mở rất mạnh mẽ.

100% Miễn Phí Giấy Phép MIT Sẵn Sàng Sản Xuất Gắn Sao & Dùng Thử

Ví dụ: Detailed fantasy landscape, ancient elven city built into a mountainside, waterfalls cascading down crystal bridges, bioluminescent gardens BREAK golden hour sunlight, dramatic cloud formations, volumetric lighting through mist, highly detailed, 8K resolution, matte painting

Điều này đảm bảo rằng các thuật ngữ ánh sáng và chất lượng bắt đầu một khối xử lý mới và nhận được sự chú ý đầy đủ thay vì bị pha loãng bởi nội dung trước đó.

Hướng Dẫn Negative Prompts Bạn Thực Sự Cần

Đây là bài phát biểu nóng của tôi về negative prompts: hầu hết mọi người làm quá phức tạp. Tôi đã thấy negative prompts dài hơn prompt thực tế, nhồi nhét với hàng chục thuật ngữ mà người đó sao chép từ một luồng Reddit mà không hiểu những gì chúng làm. Theo kinh nghiệm của tôi, một negative prompt tập trung 10-20 thuật ngữ hoạt động tốt hơn so với một cái khốn khổ với 50+ thuật ngữ.

Bài phát biểu nóng số một: Danh sách negative prompt khổng lồ là một pháp cây cho các positive prompt yếu. Nếu bạn cần phải nói với mô hình 80 điều KHÔNG làm, positive prompt của bạn có thể không cụ thể đủ. Sửa positive prompt trước, sau đó sử dụng negative prompts để xử lý các trường hợp cạnh còn lại.

Điều đó nói rằng, negative prompts thực sự hữu ích cho các vấn đề cụ thể. Đây là mẫu negative prompt go-to của tôi cho các情景 khác nhau.

Cho các hình ảnh chân thực: deformed, blurry, bad anatomy, extra limbs, poorly drawn face, mutation, disfigured, watermark, text, logo, low quality, jpeg artifacts, ugly, duplicate

Cho anime/minh họa: worst quality, low quality, normal quality, lowres, bad anatomy, bad hands, extra fingers, fewer fingers, text, watermark, signature, blurry, cropped

Cho chụp ảnh sản phẩm: text, watermark, logo, blurry, distorted, deformed, low resolution, busy background, cluttered, shadows on product, overexposed, underexposed

Thông tin chính là negative prompts nên đề cập đến các chế độ lỗi cụ thể bạn thực sự đã quan sát. Nếu mô hình của bạn liên tục tạo watermark, thêm "watermark" vào negative prompt. Nếu nó liên tục tạo ra các ngón tay bổ sung, hãy thêm "extra fingers." Nhưng đừng dán mù mịch 50 thuật ngữ bạn tìm thấy trực tuyến. Mỗi thuật ngữ negative không cần thiết sẽ hạ nhẹ tác động của những cái quan trọng.

Ý Tưởng AI Art Prompts: 10 Khái Niệm Sáng Tạo Để Thử Nghiệm

Tôi thấy rằng một trong những rào cản lớn nhất cho người mới bắt đầu là đơn giản là không biết cái gì để tạo. Bạn có công cụ mạnh mẽ này và một hộp văn bản trống, và nghịch lý của sự lựa chọn thiết lập. Dưới đây là mười khái niệm AI prompt sáng tạo tôi đã có kết quả tuyệt vời với, hoàn chỉnh với prompt bắt đầu bạn có thể sửa đổi.

1. Kiến Trúc Không Thể Architectural photograph of an impossible building, MC Escher inspired, staircases that loop back on themselves, gravity-defying walkways, brutalist concrete and glass construction, overcast sky, shot with tilt-shift lens, professional architectural photography

Thể loại này hoạt động đẹp vì các mô hình AI có thể tạo các cấu trúc không bao giờ có thể tồn tại về mặt vật lý, và kết quả liên tục quyến rũ.

2. Nhân Vật Lịch Sử Trong Cài Đặt Hiện Đại Candid street photography, Leonardo da Vinci wearing a modern tailored suit, sitting at a sidewalk cafe in Tokyo, examining a smartphone with intense curiosity, natural street lighting, passersby in background, documentary photography style

3. Các Thế Giới Vi Mô Extreme macro photography, a miniature fantasy city built inside a dewdrop on a blade of grass, tiny glowing windows, cobblestone streets visible through the water surface, early morning light refracting through the droplet, focus stacked, scientific photography quality

4. Cảm Xúc Như Phong Cảnh Surreal landscape representing the feeling of nostalgia, a winding road through golden wheat fields leading to a distant childhood home, warm sunset colors fading to cool twilight at the edges, scattered polaroid photographs floating in the breeze, dreamlike atmosphere, soft focus, painterly quality

5. Tĩnh Vật Nấu Ăn Dutch Golden Age still life painting, modern fast food arranged in classical composition, a Big Mac where the roast pheasant would be, fries in a silver chalice, dramatic window light, dark background, oil painting texture, rich warm color palette

6. Động Vật Trong Các Chuyên Nghiệp Corporate headshot photograph, a golden retriever in a perfectly tailored navy business suit, confident and professional expression, studio lighting with gray backdrop, shallow depth of field, LinkedIn profile style, photorealistic, humorous but dignified

7. Tương Lai Khí Hậu Photojournalistic image of a futuristic coastal city, half submerged in rising seas, buildings adapted with floating platforms and water-level walkways, people going about daily life, afternoon light, documentary photography style, realistic and grounded

8. Plating Ẩm Thực Fusion Professional food photography, a sushi roll made entirely of Mexican ingredients, avocado wrapped in thin tortilla, salsa where the soy sauce would be, cilantro garnish arranged with Japanese precision, clean white plate, soft directional studio light

9. Âm Nhạc Được Trực Quan Hóa Abstract digital art representing a jazz improvisation, flowing organic shapes in midnight blue and warm gold, scattered rhythm patterns like rain, a central swirling form suggesting a saxophone melody, dynamic composition with movement and energy, dark background, high contrast

Muốn bỏ qua sự phức tạp? Apatero mang đến kết quả AI chuyên nghiệp ngay lập tức mà không cần thiết lập kỹ thuật.

Không cần thiết lập Chất lượng như nhau Bắt đầu trong 30 giây Dùng Thử Apatero Miễn Phí
Không cần thẻ tín dụng

10. Công Nghệ Bị Bỏ Rơi Post-apocalyptic photography, a giant retro 1960s mainframe computer overgrown with vines and moss, sitting in an abandoned office with broken windows, forest growing through the floor, dappled sunlight, contrast between organic nature and angular technology, melancholy atmosphere

Mỗi khái niệm này hoạt động như một điểm khởi đầu. Phép thuật xảy ra khi bạn bắt đầu sửa đổi chúng với các chi tiết của riêng bạn, thay đổi ánh sáng, hoán đổi cài đặt hoặc trộn hai khái niệm lại với nhau.

Hướng Dẫn Midjourney Prompts: Những Gì Hoạt Động Khác Nhau

Tôi cần giải quyết Midjourney cụ thể vì nó xử lý prompt khác biệt nhiều so với các mô hình Stable Diffusion, và nhiều người sử dụng cả hai. Midjourney đáp ứng nhiều hơn với ngôn ngữ tâm trạng và cảm giác và ít hơn với các đặc điểm kỹ thuật máy ảnh (mặc dù nó vẫn hiểu chúng).

Bài phát biểu nóng số hai: Sức mạnh của Midjourney không nằm ở việc theo đuổi các hướng dẫn chính xác. Nó nằm ở việc diễn giải ý định nghệ thuật. Nếu bạn muốn kiểm soát từng phần tử theo từng pixel, Stable Diffusion với ControlNet là lựa chọn tốt hơn. Nhưng nếu bạn muốn mô hình cộng tác với bạn một cách sáng tạo, "lỏng" của Midjourney thực sự là một lợi thế.

Dưới đây là cùng một khái niệm được nhắc lại cho mỗi nền tảng.

Phiên bản Stable Diffusion: professional portrait photograph of a young woman, (heterochromia:1.3), one blue eye and one green eye, auburn hair in a messy bun, light freckles across nose, wearing an oversized cream knit sweater, sitting on a windowsill, rain on the window glass, soft natural light from overcast sky, shallow DOF, shot on Sony A7III with 85mm f/1.8 lens, film emulation, warm color grade

Phiên bản Midjourney: portrait of a woman with heterochromia, one blue eye one green, auburn hair loosely pinned up, freckled, cozy knit sweater, rainy window light, contemplative mood, intimate and warm, editorial photography --ar 2:3 --style raw

Lưu ý cách phiên bản Midjourney ngắn hơn và gợi cảm hơn. Nó tập trung vào cảm giác và khí quyển thay vì các đặc điểm kỹ thuật. Tham số --style raw của Midjourney cung cấp cho bạn kết quả nhiếp ảnh hơn, trong khi --stylize (mặc định) thêm nhiều thẩm mỹ đặc trưng của Midjourney.

Các Tham Số Midjourney Chính

  • --ar 16:9 or --ar 2:3 for aspect ratio
  • --style raw for more literal prompt interpretation
  • --stylize 50 (low) to --stylize 750 (high) for artistic interpretation level
  • --chaos 0-100 for variation between generated images
  • --no followed by terms acts as a negative prompt

Kỹ Thuật Prompt Engineering Nâng Cao

Khi bạn đã nắm vững những điều cơ bản, có một số kỹ thuật nâng cao có thể đẩy kết quả của bạn xa hơn. Đây là những thủ đoạn tôi sử dụng hàng ngày trên Apatero cho công việc khách hàng, và chúng tách biệt các kỹ sư prompt trung gian với các kỹ sư nâng cao.

Kỹ Thuật 1: Trộn Phong Cách

Kết hợp hai hoặc nhiều phong cách hình ảnh khác biệt trong một prompt duy nhất để tạo ra một cái gì đó thực sự mới mẻ. Mô hình nội suy giữa các phong cách và tạo ra kết quả cảm thấy tươi mới và nguyên bản.

Ví dụ: Portrait in the style of a Renaissance oil painting combined with cyberpunk aesthetics, a noble woman in elaborate 16th century dress with neon circuitry patterns woven into the fabric, traditional ruff collar that glows with holographic light, classical pose and composition, dramatic chiaroscuro lighting mixed with neon accent lights, oil painting brush texture with digital glitch artifacts

Điều này hoạt động vì mô hình có thể trộn dữ liệu đào tạo từ cả hai miền. Sự căng thẳng giữa các yếu tố cổ điển và tương lai tạo ra sự quan tâm về hình ảnh mà bất kỳ phong cách nào một mình không thể đạt được.

Kỹ Thuật 2: Ngôn Ngữ Chỉ Đạo Máy Ảnh

Thay vì mô tả hình ảnh một cách tĩnh tại, mô tả nó như thể bạn đang chỉ đạo nhà điều hành máy ảnh. Cách tiếp cận này hoạt động tuyệt vời để tạo thành phần động.

Ví dụ: Camera slowly pushing in on a detective standing at the end of a rain-soaked alley, shot from low angle emphasizing his silhouette against the neon signs behind him, rack focus from the foreground puddle reflecting city lights to his face, anamorphic lens flares, 35mm film grain, neo-noir cinematography

Ngôn ngữ chuyển động ("pushing in," "rack focus") không tạo ra chuyển động thực, nhưng nó chuẩn bị mô hình để tạo ra hình ảnh có độ sâu điện ảnh và ý định.

Kỹ Thuật 3: Liên Kết Ngữ Cảnh

Tham khảo một ngữ cảnh thực tế cụ thể mà mô hình có dữ liệu đào tạo mạnh. Điều này căn cứ hình ảnh của bạn trong một ngôn ngữ hình ảnh có thể nhận biết được trong khi cho phép bạn tùy chỉnh các chi tiết.

Ví dụ: National Geographic cover photograph, an Arctic fox mid-leap through fresh powder snow, captured at 1/2000 shutter speed freezing the motion, snow crystals suspended in air, harsh winter sunlight creating rim lighting on the fox's white fur, pure white environment, wildlife photography, Canon EOS R3 with 400mm telephoto lens

Bằng cách liên kết với "National Geographic cover photograph," bạn kích hoạt một cụm cụ thể của hình ảnh động vật hoang dã chất lượng cao, được chụp chuyên nghiệp trong dữ liệu đào tạo của mô hình. Kết quả ngay lập tức có sự trọng vọng và bóng bẩy kỹ thuật được liên kết với ấn phẩm đó.

Kỹ Thuật 4: Nhiệt Độ Cảm Xúc

Đây là một cái gì đó tôi vô tình phát hiện ra và bây giờ sử dụng liên tục. Mô tả "nhiệt độ" cảm xúc của cảnh bằng cách sử dụng ngôn ngữ cảm giác tạo ra kết quả gợi cảm hơn so với các mô tả thuần túy hình ảnh.

Ví dụ: The quiet stillness of a bookshop just before closing time, warm pools of lamplight on dark wooden shelves, the weight of thousands of stories hanging in the air, a single reader absorbed in a book by the window, the outside world blurred and forgotten, intimate and meditative atmosphere, the comfortable solitude of being alone by choice

Chương Trình Sáng Tạo

Kiếm Tới $1.250+/Tháng Tạo Nội Dung

Tham gia chương trình liên kết sáng tạo độc quyền của chúng tôi. Được trả tiền theo hiệu suất video viral. Tạo nội dung theo phong cách của bạn với tự do sáng tạo hoàn toàn.

$100
300K+ views
$300
1M+ views
$500
5M+ views
Thanh toán hàng tuần
Không chi phí ban đầu
Tự do sáng tạo hoàn toàn

Không phải mỗi từ trong prompt này ánh xạ tới một phần tử hình ảnh, nhưng ngôn ngữ cảm xúc ảnh hưởng đến các lựa chọn của mô hình về nhiệt độ màu, thành phần và các mối quan hệ không gian theo những cách mà các prompt thuần túy kỹ thuật không thể sao chép.

Sai Lầm Prompt Phổ Biến Với Sửa Chữa Trước Và Sau

Tôi muốn cung cấp cho bạn một số ví dụ trước và sau cụ thể vì thấy các điều chỉnh thực tế trong bối cảnh hữu ích hơn lời khuyên trừu tượng. Để xem sâu hơn về cách chọn công cụ phù hợp cho hình ảnh của bạn, hãy xem so sánh của tôi về comparison of the best AI image generators in 2026.

Sai Lầm: Không Có Hướng Bố Cục

Trước: a knight on a horse in a field

Sau: Epic wide-angle shot, a lone medieval knight in full plate armor mounted on a black warhorse, positioned in the right third of the frame, vast open field stretching to distant mountains, dramatic storm clouds building overhead, late afternoon side lighting casting long shadows, grass bending in the wind, cinematic composition with strong leading lines from the field toward the rider

Sai Lầm: Các Thuật Ngữ Mâu Thuẫn

Trước: bright sunny dark moody portrait, happy sad expression, colorful monochrome

Sau: Moody low-key portrait, dramatic side lighting with deep shadows, desaturated color palette leaning toward cool blues and grays, contemplative expression with a slight tension in the jaw, dark studio background

Các prompt mâu thuẫn làm bối rối mô hình và tạo ra kết quả không mạch lạc. Chọn một hướng và cam kết với nó.

Sai Lầm: Quá Nhiều Chủ Thể

Trước: a dragon and a knight and a wizard and a princess and a castle and a forest and a river and mountains and stars

Sau: Fantasy illustration, a dragon and a knight locked in combat on a stone bridge over a misty chasm, the knight's shield raised against a blast of blue dragonfire, dramatic low angle, focus on the moment of impact, dark fantasy atmosphere, detailed armor and scale textures

Mỗi chủ thể bổ sung làm loãng sự chú ý của mô hình. Những chủ thể ít hơn với chi tiết hơn vượt trội hơn nhiều chủ thể mà không có chi tiết, mỗi lần.

Xây Dựng Bộ Tạo Prompt AI Image Của Riêng Bạn

Bài phát biểu nóng số ba: Các công cụ bộ tạo prompt AI hầu như không cần thiết nếu bạn hiểu công thức. Hầu hết trong số đó chỉ ngẫu nhiên hóa một danh sách các thuật ngữ từ cơ sở dữ liệu, và kết quả cảm thấy ngẫu nhiên vì chúng. Bạn sẽ tốt hơn nếu xây dựng một thư viện cá nhân của các phân đoạn prompt mà bạn biết hoạt động tốt với mô hình ưa thích của bạn.

Điều đó nói rằng, có một mẫu có cấu trúc để điền vào có lợi, đặc biệt khi bạn tạo hình ảnh nhanh chóng. Đây là mẫu tôi sử dụng cho chính mình. Tôi coi nó như một "bộ tạo prompt" chạy trong đầu của tôi thay vì trong một ứng dụng.

Mẫu Prompt Cá Nhân Của Tôi:

[STYLE]: _________________ (e.g., oil painting, photograph, 3D render)
[SUBJECT]: _________________ (who/what, with 3-5 specific details)
[ACTION/POSE]: _________________ (what are they doing)
[SETTING]: _________________ (where, with 2-3 environmental details)
[LIGHTING]: _________________ (type, direction, mood)
[CAMERA]: _________________ (lens, angle, depth of field)
[QUALITY]: _________________ (resolution, detail level, reference)
[MOOD]: _________________ (one or two emotional descriptors)

Ví dụ được điền:

[STYLE]: Cinematic film still, anamorphic widescreen
[SUBJECT]: A weary astronaut with a cracked helmet visor,
           dust-covered white spacesuit, visible condensation inside helmet
[ACTION/POSE]: Kneeling in sand, one hand pressing into the ground
[SETTING]: Surface of Mars, rust-red desert stretching to horizon,
           distant rocky formations, thin atmosphere
[LIGHTING]: Harsh directional sunlight from upper left,
            long dramatic shadow, warm amber tones
[CAMERA]: Wide angle 24mm lens, low angle shot,
          deep depth of field, everything sharp
[QUALITY]: 8K, photorealistic, hyper-detailed,
           sci-fi movie production value
[MOOD]: Isolation, determination

Prompt kết hợp: Cinematic film still, anamorphic widescreen. A weary astronaut with a cracked helmet visor and dust-covered white spacesuit, visible condensation inside the helmet, kneeling in red sand with one hand pressing into the ground. Surface of Mars, rust-red desert stretching to the horizon, distant rocky formations, thin hazy atmosphere. Harsh directional sunlight from upper left casting a long dramatic shadow, warm amber tones. Wide angle 24mm lens, low angle shot, deep depth of field. 8K, photorealistic, hyper-detailed, sci-fi movie production value. A feeling of isolation and quiet determination.

Cách tiếp cận mẫu này cung cấp cho bạn tính nhất quán của một bộ tạo prompt AI image mà không có tính ngẫu nhiên. Khi bạn nội hóa các danh mục, bạn có thể điền vào chúng về mặt tinh thần trong khoảng 30 giây.

Mẹo và Thủ Đoạn Prompt Từ 60,000+ Thế Hệ

Tôi muốn đóng lại phần hướng dẫn chính bằng một danh sách các mẹo được giành được khó khổ. Những điều như thế này là những gì tôi ước là ai đó đã nói với tôi khi tôi bắt đầu. Mỗi cái đều xuất phát từ một sự bực bội cụ thể tôi gặp phải và giải quyết trong công việc của tôi trên Apatero và các dự án cá nhân của tôi.

1. Front-load các thuật ngữ quan trọng nhất. Hầu hết các mô hình cân nặng cao hơn các từ xuất hiện sớm hơn trong prompt. Nếu phong cách là khía cạnh quan trọng nhất, hãy đặt nó trước. Nếu chủ thể quan trọng nhất, hãy dẫn với điều đó.

2. Sử dụng danh từ cụ thể thay vì tính từ trừu tượng. "A woman standing beside a 1967 Ford Mustang Fastback" cung cấp cho mô hình nhiều hơn để làm việc với so với "a woman standing beside a cool vintage car." Sự cụ thể là bạn của bạn.

3. Tham khảo các thuật ngữ nhiếp ảnh thực tế ngay cả cho minh họa. Các thuật ngữ như "golden hour," "rim lighting" và "shallow depth of field" ảnh hưởng đến các kết quả được minh họa và vẽ quá, không chỉ những cái chân thực. Mô hình đã học những khái niệm này như các tính chất hình ảnh, không phải chỉ những kỹ thuật chụp ảnh.

4. Mô tả những gì bạn muốn, không phải những gì bạn không muốn. Tiết kiệm không gian âm cho actual negative prompts. Viết "a dog, not a cat, not a bird, no other animals" lãng phí positive prompt space. Thay vào đó viết "a single golden retriever, alone."

5. Kiểm tra một biến tại một thời điểm. Khi một prompt không hoạt động, hãy thay đổi một điều giữa các thế hệ. Nếu bạn thay đổi năm điều cùng một lúc, bạn sẽ không biết thay đổi nào đã sửa vấn đề hoặc cái nào đã phá vỡ một cái gì đó khác.

6. Giữ một nhật ký prompt. Tôi duy trì một tập tin văn bản đơn giản nơi tôi lưu các prompt tạo ra kết quả xuất sắc, cùng với mô hình và cài đặt được sử dụng. Thư viện prompt này đã trở thành một trong những tài nguyên có giá trị nhất của tôi. Theo thời gian, các mô hình xuất hiện về những gì hoạt động cho bạn cụ thể.

7. Nghiên cứu nghệ thuật thực và nhiếp ảnh. Các kỹ sư prompt tốt nhất tôi biết không phải chỉ có kỹ thuật. Họ hiểu nghệ thuật hình ảnh. Họ biết điều gì làm cho một thành phần mạnh mẽ, tại sao các cung cấp màu sắc nhất định kích thích những cảm xúc nhất định, và cách các nhiếp ảnh gia chuyên nghiệp sử dụng ánh sáng. Kiến thức này trực tiếp dịch thành các prompt tốt hơn.

8. Từ "detailed" được sử dụng quá mức và dưới chi tiết. Thay vì nói "detailed," nói loại chi tiết bạn muốn. "Visible wood grain texture," "individual eyelashes," "intricate lacework pattern" tất cả cung cấp cho mô hình các mục tiêu chi tiết cụ thể thay vì một hướng dẫn mơ hồ để thêm nhiều thứ.

Để biết thêm kỹ thuật về việc tạo ra đầu ra chất lượng thực sự chuyên nghiệp, hãy xem professional AI image generation guide.

Kỹ Thuật Prompt Engineering Trên Các Mô Hình Khác Nhau Trong 2026

Bối cảnh tạo hình ảnh AI đã phát triển đáng kể. Mỗi mô hình có những tính kỳ lạ và sức mạnh của nó, và prompt tương tự sẽ tạo ra kết quả khác nhau tùy thuộc vào nơi bạn chạy nó. Đây là một cái nhìn tổng quan nhanh về cách thích ứng chiến lược viết prompt của bạn.

Stable Diffusion XL và SD 3.5: Đáp ứng tốt với các mô tả được phân tách bằng dấu phẩy và cú pháp trọng số prompt. Negative prompts cần thiết. Hưởng lợi từ các từ kích hoạt cụ thể checkpoint. Tốt nhất cho người dùng muốn kiểm soát tối đa.

Flux (Pro và Dev): Xử lý các prompt ngôn ngữ tự nhiên ngoài sức tưởng tượng. Bạn có thể viết trong các câu hội thoại và nó tuân theo các hướng dẫn chính xác. Ít phụ thuộc vào keyword stuffing. Mô hình tôi tiếp cận nhiều nhất khi tôi cần tuân theo prompt chính xác.

Midjourney v6/v7: Diễn giải nghệ thuật là mạnh. Các prompt gợi cảm ngắn hơn thường hoạt động tốt hơn những prompt dài cực kỳ. Cờ --style raw cần thiết để giảm "Midjourney look." Cờ tham số xử lý tỷ lệ khung hình, phong cách hóa và hỗn loạn. Theo Midjourney's documentation, v7 đã cải thiện đáng kể theo dõi prompt.

DALL-E 3 (thông qua ChatGPT): Độc đáo ở chỗ ChatGPT viết lại prompt của bạn trước khi gửi nó đến mô hình. Hoạt động tốt nhất với mô tả ngôn ngữ tự nhiên. Kiểm soát trực tiếp ít hơn nhưng rất dễ tiếp cận cho người mới bắt đầu. OpenAI documentation cung cấp hướng dẫn hữu ích về cấu trúc prompt để có kết quả tốt nhất.

Nano Banana và Fast Models: Những mô hình được tối ưu hóa tốc độ này hoạt động tốt nhất với các prompt tập trung, tập trung. Chúng không xử lý các prompt cực kỳ dài cũng như các đối tác lớn hơn, nhưng chúng hoàn hảo cho lặp lại nhanh chóng và khám phá khái niệm.

Hiểu những khác biệt này là quan trọng. Một prompt được tối ưu hóa cho Stable Diffusion với trọng số ngoặc đơn sẽ làm bối rối Midjourney, và một prompt Midjourney gợi cảm ngắn có thể không cung cấp cho Stable Diffusion đủ để làm việc. Khớp phong cách viết prompt của bạn với mô hình của bạn. Để xem xét rộng hơn về cách văn bản trở thành hình ảnh trên tất cả các nền tảng này, bài viết của tôi về text-to-image AI bao gồm các nguyên tắc cơ bản.

Câu Hỏi Thường Gặp

Các AI image prompts tốt nhất cho người mới bắt đầu là gì?

Bắt đầu với công thức năm lớp được đề cập trong hướng dẫn này: medium/style, subject with details, environment, lighting, và quality terms. Một prompt người mới bắt đầu mạnh mẽ tuân theo mô hình "a [style] of [detailed subject] in [setting], [lighting description], [quality terms]." Tập trung vào tính cụ thể về một điều tại một thời điểm thay vì cố gắng kiểm soát mọi thứ một lần. Khi bạn có kinh nghiệm, bạn sẽ tự nhiên thêm nhiều lớp chi tiết hơn vào các prompt của bạn.

Độ dài AI image prompts nên bao lâu?

Đối với hầu hết các mô hình, 30-75 từ là điểm ngọt. Các prompt ngắn hơn cung cấp cho mô hình quá nhiều tự do sáng tạo (thường có nghĩa là kết quả chung chung), trong khi các prompt cực kỳ dài có thể gây ra các chi tiết quan trọng bị loãng hoặc bỏ qua. Stable Diffusion xử lý các prompt trong các khối 77 token, vì vậy giữ các thuật ngữ quan trọng nhất của bạn trong khối đầu tiên đảm bảo chúng nhận được sự chú ý đầy đủ. Midjourney nói chung hoạt động tốt nhất với các prompt dưới 60 từ.

Negative prompts thực sự tạo ra sự khác biệt không?

Có, nhưng ít hơn hầu hết mọi người nghĩ. Một positive prompt được xây dựng tốt ảnh hưởng đến xa hơn so với một negative prompt. Negative prompts được sử dụng tốt nhất để giải quyết các vấn đề lặp lại cụ thể bạn đã quan sát, như các ngón tay bổ sung, watermark hoặc sự mơ hồ. Sao chép danh sách negative prompt khổng lồ từ các diễn đàn mà không hiểu chúng có thể thực sự làm giảm kết quả của bạn bằng cách quá mức hạn chế mô hình.

Sự khác biệt giữa viết prompt cho Stable Diffusion so với Midjourney là gì?

Stable Diffusion phản ứng tốt với danh sách từ khóa được phân tách bằng dấu phẩy, trọng số prompt với dấu ngoặc đơn và các thuật ngữ nhiếp ảnh kỹ thuật. Midjourney thích các mô tả ngôn ngữ tự nhiên hơn tập trung vào tâm trạng và ý định nghệ thuật. Stable Diffusion yêu cầu explicit negative prompts, trong khi Midjourney sử dụng tham số --no cho phiên bản đơn giản hơn của cùng một khái niệm. Cả hai được hưởng lợi từ các mô tả chủ thể cụ thể, nhưng Midjourney tha thứ hơn với các prompt mơ hồ.

Tôi có thể sử dụng cùng một prompt trên các mô hình AI image khác nhau không?

Bạn có thể, nhưng bạn không nên mong đợi kết quả giống hệt nhau. Mỗi mô hình diễn giải prompt khác nhau dựa trên dữ liệu đào tạo và kiến trúc của nó. Một prompt được tối ưu hóa cho một mô hình có thể tạo ra kết quả kém trên một mô hình khác. Cách tiếp cận tốt nhất là học công thức cơ bản và sau đó điều chỉnh nó cho điểm mạnh cụ thể và yêu cầu cú pháp của mỗi nền tảng.

Làm cách nào để tôi có được các ký tự nhất quán trên nhiều hình ảnh?

Tính nhất quán ký tự là một trong những thách thức khó khăn hơn trong tạo hình ảnh AI. Đối với Stable Diffusion, đào tạo một LoRA trên ký tự của bạn là cách tiếp cận đáng tin cậy nhất. Đối với Midjourney, sử dụng các mô tả ký tự chi tiết với các mô tả áo quần và tính năng nhất quán giúp. Khả năng theo dõi prompt của Flux làm cho nó trở thành một trong những lựa chọn tốt hơn để duy trì tính nhất quán thông qua prompt thuần túy một mình.

Các AI art prompts tốt nhất để bán bản in là gì?

Các prompt tạo ra nghệ thuật xứng đáng in thường bao gồm các thuật ngữ bố cục mạnh ("rule of thirds," "golden ratio"), các công cụ chỉnh sửa chất lượng độ phân giải cao ("8K," "highly detailed") và các mô tả phong cách nghệ thuật riêng biệt. Nghệ thuật trừu tượng, phong cảnh và chân dung phong cách hóa có xu hướng bán tốt nhất. Tránh các prompt tạo ra kết quả quá chung chung. Thị trường thưởng những thành phần độc đáo, hình ảnh tuyệt vời mà mọi người muốn hiển thị trong nhà của họ.

Làm cách nào để tránh "AI look" trong các hình ảnh được tạo?

"AI look" thường đến từ bề mặt da quá mịn, đối xứng hoàn hảo và một chất lượng bóng bẩy nhất định. Chống lại điều này bằng cách thêm các thuật ngữ như "natural skin texture," "slight asymmetry," "subtle imperfections," "film grain" và "authentic feel." Tham khảo các phim quay cụ thể (như "Kodak Portra 400" hoặc "Fuji Pro 400H") cũng giúp giới thiệu chất lượng hữu cơ mà sự hoàn hảo kỹ thuật số thiếu.

Tại sao các prompt của tôi liên tục tạo ra các ngón tay hoặc tay bị biến dạng bổ sung?

Tay vẫn là một thách thức cho hầu hết các mô hình tạo hình ảnh AI, mặc dù các phiên bản mới nhất đã cải thiện đáng kể. Sử dụng negative prompts nhắm mục tiêu "extra fingers, deformed hands, bad anatomy" và bao gồm các thuật ngữ tích cực như "perfectly formed hands, five fingers, anatomically correct." Khi có thể, soạn cảnh của bạn để tay không phải là điểm tiêu điểm, hoặc sử dụng inpainting để sửa các vấn đề tay trong hậu xử lý. Các mô hình như Flux và SDXL xử lý tay đáng chú ý tốt hơn so với các kiến trúc cũ hơn.

Có một thứ tự lý tưởng cho các từ trong AI image prompts không?

Vâng. Hầu hết các mô hình cân nặng cao hơn các thuật ngữ xuất hiện sớm hơn trong prompt. Đặt mô tả quan trọng nhất của bạn trước tiên. Thứ tự được đề xuất nói chung là: medium/style, primary subject, key attributes, setting/environment, lighting, mood, và quality modifiers. Nếu một yếu tố cụ thể là quan trọng với tầm nhìn của bạn, hãy di chuyển nó về phía trước của prompt bất kể thứ tự mặc định này.

Suy Nghĩ Cuối Cùng

Kỹ thuật viết prompt cho hình ảnh AI không phải là một nghệ thuật tối đa. Nó là một kỹ năng có thể học được với các nguyên tắc và mô hình rõ ràng. Công thức tôi đã chia sẻ trong hướng dẫn này, cách tiếp cận năm lớp của phương tiện, chủ thể, cài đặt, ánh sáng và chất lượng, hoạt động vì nó phản ánh cách các sáng tạo chuyên nghiệp luôn giao tiếp các ý tưởng hình ảnh. Giám đốc sáng tạo viết các bản sơ yếu lý lịch sáng tạo. Các nhiếp ảnh gia chia sẻ danh sách chụp. Các nghệ sĩ concept nhận các tài liệu thiết kế. Các prompt hình ảnh AI của bạn đơn giản là một phiên bản hiện đại của cùng một thực hành.

Sự thay đổi lớn nhất tôi có thể đề xuất là dừng coi viết prompt như tìm kiếm và bắt đầu coi nó như chỉ hạch toán. Bạn không yêu cầu mô hình tìm một hình ảnh. Bạn nói nó chính xác cái gì để tạo. Bạn giao tiếp tầm nhìn của mình chính xác hơn, mô hình cung cấp nó chính xác hơn.

Bắt đầu với công thức, thực hành với các ví dụ trong bài viết này, và xây dựng thư viện prompt cá nhân của bạn theo thời gian. Trong vài tuần, bạn sẽ viết hiệu quả ai image prompts theo bản năng, và khoảng cách chất lượng giữa công việc của bạn và hình ảnh được tạo trung bình sẽ rõ ràng.

Bây giờ đi tạo một cái gì đó đáng để xem.

Sẵn Sàng Tạo Influencer AI Của Bạn?

Tham gia cùng 115 học viên đang thành thạo ComfyUI và tiếp thị influencer AI trong khóa học 51 bài đầy đủ của chúng tôi.

Giá sớm kết thúc trong:
--
Ngày
:
--
Giờ
:
--
Phút
:
--
Giây
Đặt Chỗ Của Bạn - $199
Tiết Kiệm $200 - Giá Tăng Lên $399 Vĩnh Viễn