最近,一场围绕AI生成图像版权的风暴引爆了科技与创意圈。
迪士尼和环球影业联手对一家名叫Midjourney的初创公司发起法律诉讼,理由是它生成的图像可能侵犯了旗下视觉资产的版权。这是AI工具首次如此直接地挑战好莱坞内容霸主的“审美主权”。
可讽刺的是,这家公司却在全球创作者社区持续爆火:它没有界面,没有按钮,甚至连App都没有,用户只需在Discord里输入几句英文,就能在几秒内生成极具艺术感的图像——梦幻、瑰丽、富有想象力,甚至远超专业设计师的表现力。
它的名字叫做:Midjourney。
这家公司没有融资,团队不到50人,却用一种近乎诗意的产品逻辑,重塑了人们对“创造”这件事的理解。对创业者来说,Midjourney不是一个技术范式的案例,而是一场关于想象力的制度性重构。本周,混沌AI君将为你全面拆解这个AI神作背后的商业逻辑与创始人哲学,或许能为你带来比产品增长更深远的启发。
什么是Midjourney?它做成了什么?
Midjourney是一个AI图像生成平台,用户只需输入几行文字(Prompt),系统就能输出高质量的图像。其技术底层基于Diffusion模型(扩散式图像生成),与DALL·E、Stable Diffusion类似,但更强调“风格化”“美学控制”和“用户体验”。
这款产品从2022年开始公测,短短一年多就吸引了超过1600万注册用户。不同于传统AI工具冷冰冰的功能式界面,Midjourney将产品完全寄托在Discord社群上,用户之间像“晒朋友圈”一样晒Prompt和生成图,不断启发和模仿彼此,形成了独特的共创文化。
它不仅创造了一个新兴的“Prompt经济”,还催生了大量围绕视觉创作的新职业,如AI美术指导、Prompt设计师、AI品牌视觉顾问等。更令人惊讶的是,Midjourney团队不到50人,却在短短时间内实现了年营收2亿美金的奇迹,人均产出超过500万美元,远超行业常规水平。
传统工具的桎梏与Midjourney的破局:社群就是产品,Prompt就是想象力
在了解Midjourney之前,我们不妨回顾一下传统数字创作工具的困境。
长期以来,无论是Photoshop这类专业软件,还是早期的AI绘图插件,都存在明显价值失衡:输出效率和创意来源受限,创作高度依赖设计师个人的手绘功底和灵感积累。供需之间的矛盾由此产生,效率提不上去、灵感突破不了天花板,而Midjourney的出现,则提供了一条破局之路:与Adobe、Figma这些主流创意工具相比,Midjourney并没有强调功能的多与强。它选择了完全相反的方向:
不提供图层;
没有图形工具;
没有UI界面。
它所做的是,把创作这件事从“技术操作”变成“意念表达”。这背后是一种完全不同的哲学:人类的思想是创作的中心,工具应该像神经元的延伸,而不是流程的外壳。
Midjourney让我们看到,AI不只是效率工具,更可以成为“感知的放大器”。这也是它的错位竞争之道:
Midjourney并非只是简单叠加了技术和社区元素,而是从源头上重构了数字创意工具的范式。传统的设计软件遵循的是一种“一对一、封闭式”的创作模式——设计师独立操作工具,为单个客户服务,强调严谨的流程和精细的控制;而早期一些AI绘图工具则往往只是附加功能,零星地帮助生成素材,缺乏生态和互动。
Midjourney选择跳出这两种窠臼,构建一个多维交互的创意平台。
首先,它颠覆了交互方式。与大多数图形软件的界面不同,Midjourney选择了把产品嵌入Discord聊天界面来提供服务。用户不需要打开独立应用,而是在Discord的对话框里像聊天一样输入描述。(如上图所示)
过去,创作者是通过点按钮、调参数来控制软件,而Midjourney则引入了“文本提示→图像生成”的全新对话式交互范式。创作者不再需要面对繁琐的面板,而是通过与AI“对话”来传达意图——从手动调参转变为语言思维的交流。这相当于把创作过程中的沟通维度提前并放大了:以前设计师和客户的沟通在绘图开始前,现在创作者直接与AI不断沟通试验,使创意在交流中实时成型。
其次,它打破了用户孤岛。Midjourney的诞生土壤是一个高度活跃的线上社区。用户在Discord的公共频道里实时生成并分享作品,彼此观摩交流。而Midjourney团队成员也混迹其中,第一时间观察用户偏好和反馈。这种公开创作环境形成了“反馈–迭代–传播”的闭环:一个用户生成的佳作会激发其他用户模仿甚至改进prompt(提示词),新的创意又被不断传播。可以说,社区提供了远超单个设计师想象力的集体大脑,每个人既是创作者,也是观众和评论者,整个社区仿佛一个巨大的创意工作坊,不断自我加速进化。
通过对交互模式和用户角色的重塑,Midjourney不再是一款冷冰冰的工具,而更像一个创意游乐场和协作社群。它将传统模式中分散的点连成了网:创作者、观众、AI三方在同一空间实时互动,催生出前所未有的创作体验。
差异化定位:重新定义“创作方式”
回顾Midjourney走过的路,我们发现它的战略成功,很大程度上来源于差异化的精确定位——Midjourney并没有去正面挑战Adobe等巨头主导的主流市场,而是错位切入,在主流价值网忽视的领域开辟了一片新天地。
更重要的是,Midjourney迁移了创作的重心,改变了“人—工具—作品”三者之间的关系。
以往人通过工具费力地塑造作品,现在人更多是通过AI去探索作品的可能性——这种想象驱动+AI生成+社交共创的组合,让Midjourney跳脱出了传统工作流,进入了一个新的价值空间。Discord平台就成为承载这个新价值网的空间:Midjourney最早吸引的用户并非传统业内人士,而是一批游戏社区成员、数字艺术爱好者等边缘人群。
他们乐于尝鲜,对新事物接受度高,于是在Discord这个他们原本就活跃的平台上,Midjourney很快聚集起第一批忠实用户。有了这些先锋用户的反馈,Midjourney不断迭代完善,很快其生成效果就达到了“专业结果+非专业路径”的惊人结合——也就是用门槛极低的方式却能产出接近专业水准的成果。
如今,随着版本升级和功能增强,Midjourney开始从极客小圈子迈向主流商业市场,它已经能较好满足广告、电商、出版等行业的一些实际需求,这标志着Midjourney正处于从边缘到主流的扩张跃迁中。
这个过程类似创新理论中的S曲线跨越:一开始在小众市场生根发芽,技术逐渐成熟,随后带动大众市场的爆发性增长。Midjourney目前正攀登在新的S曲线上:AI视觉设计正从过去的辅助工具向“创作前置平台”转变,也就是先由AI生成初稿,再由人类修改润色,取代过去纯人工从零开始的流程。
可以说,Midjourney通过差异化定位与错位竞争,避开了与Photoshop等正面比拼功能的红海,而是在无人争夺的蓝海中一路高歌猛进。这种战略眼光来自对“创作方式”的重新定义——Midjourney不是在卖一款工具,而是在提供一种“想象力具现化服务”。它重塑了人们进行视觉创作的路径,也因此构筑了自己的护城河。
创始人理念:AI成为人类想象的引擎
最后,在探讨Midjourney成功的商业策略和技术创新之余,更深层的驱动力来自于创始人David Holz及其团队所坚守的核心理念。可以说,正是这一套“想象力至上”的产品哲学,塑造了Midjourney独树一帜的气质和道路。
Holz常用一个隐喻来描述Midjourney的愿景:它不是一款图像工具,而是一部“思想与想象力的交通工具”。他认为,就像引擎驱动车辆一样,AI可以驱动人的精神旅行。一句话,Midjourney要做的不是替代人去画什么图,而是打开一个人人都能进入的想象空间,让AI成为扩展人类思维的引擎。这种对AI角色的定位,和很多主打效率替代的AI产品截然不同——Midjourney追求的不是让机器代劳人类的工作,而是让机器帮助人类发挥出他们本来无法轻易发挥的创造力。
在Holz看来,“工具”一词都不足以形容Midjourney的定位。他甚至说过:“一个工具不应该像一个人,而应该像你的思想延伸。”他反对让AI去模仿人或代替人,反而主张AI应该成为人意志的延长线。这直接影响了Midjourney的产品设计哲学——没有复杂的界面,没有图层、滤镜这些传统软件的逻辑结构,而只是一个极简的文本框。这样的设计初衷,就是希望让用户感觉在使用Midjourney时,几乎没有“工具”的存在感,而更像是在用语言直接表达自己的想法。语言即画笔,想象即画布,Midjourney尽量消除了人和画面之间的隔阂。这种“去工具化”的思路归根结底是一种人本位的思想:让技术透明,让创造者的思绪自由流动。
Holz还推崇一种想象力的平权主义。在他眼中,创造力不该被少数专业精英垄断,每个人都应有平等的机会表达内心的想象。他曾直言:“创造力不应该被工具复杂性和专业门槛所阻隔。”Midjourney存在的意义,就是要做那个拆除门槛的工具,让所有有想法的人都能将脑海中的世界具现出来。这一价值观直接对抗了Adobe等传统创意工具所代表的“技能垄断”——过去只有受过训练的人才能熟练使用那些复杂软件,因而他们掌握了创意生产的主导权。而Midjourney试图去精英化创作过程,让任何普通人也能成为创作者,人人皆可创造,人人皆可表达。在Midjourney的平台上,用户彼此之间身份的界限被模糊了:专业艺术家和新手小白都站在同一起跑线上,用文字交互的方式释放创意。这正体现了Holz所信奉的创作平权理念。
而这,也许才是迪士尼和环球影业要盯上这家还不到三岁的公司的本质:
Midjourney正在挑战他们对“图像审美主权”的控制。传统内容巨头长期掌控着视觉文化的叙事权,他们希望你在看电影、动画、海报时,脑海中浮现的审美“基准”由他们定义。而Midjourney,让每一个普通人都有能力创造“自己的视觉世界”。这也许才是他们焦虑的来源:不是版权,而是审美垄断地位被打破的恐惧。
David Holz从不鼓吹AI替代人类。他关心的,是AI如何拓展人类感知的边界。他的理念可以浓缩为一句话:
“最强大的工具,不是掌握信息的机器,而是能唤醒人类想象的镜子。”
面对巨头的控诉,我们不妨换个角度思考:
如果每个人都能自由创造图像,会怎样?
如果不再有“标准美术风格”,我们的世界会不会更丰富?
如果创造的主权,重新回到个体手中,是不是才真正有了民主化的可能?
Midjourney并非完美,也面临风险。但它让我们看到,技术的意义,不是再造权力,而是赋予表达。这种理念,或许正是未来创意产业与AI原生最值得相信的方向。
这些核心理念可以归纳为一句话:技术为思想服务,AI是人类想象的助推器而非取代者。Midjourney团队始终坚守这样的价值观,不随波逐流地去做那种纯商业导向的选择。例如,他们至今没有开放任何商业API接口,也拒绝把Midjourney做成一个嵌入他人产品的插件式工具。这在很多投资人看来是错失良机,但Holz坚持Midjourney应该首先服务个体创造者的体验和美学,而不是沦为企业流水线的一部分。
他们甚至不急于商业化变现,Holz公开表示“不着急IPO,不追求快速赚钱,我们做这个项目是为了创造一些新的、也许是美的事物”。
在他心中,商业是副产物,创造才是目的。
这种“慢商业、重内核”的战略决策让Midjourney避免了浮躁的扩张,而是按自己的节奏扎实前进。Holz还曾说过:
“最强大的产品,应该像诗一样被感知。”
Holz的理念不仅是口号,而且渗透进了Midjourney的产品、组织、战略等方方面面,形成了一套结构性的创新:
在产品策略上,团队有意在模型训练中注入美学主导。他们并不追求一个纯中性的、完全由用户决定风格的工具,而是塑造出Midjourney独有的“AI美学”。例如偏重情绪渲染、光影效果,甚至专门提供“/weird”等指令来鼓励古怪离谱的创意,目的在于探索“秩序中的混沌美”。这些都体现了Holz对艺术和未知之美的尊重,他希望Midjourney唤起的是用户视觉感知上的诗意共鸣,而非千篇一律的流水线风格。
整个组织架构依附于Discord社区运作:用户的Prompt被视为一种宝贵的资产沉淀,作品是大家交流的语言,而用户反馈更是直接驱动产品演化的机制。Midjourney团队不过是与社区共生的一员,而不是凌驾于用户之上的封闭机构。这种组织形态并不以效率、利润为导向,而更强调共情和共创。
正因为此,Midjourney敢于拒绝一些典型的商业“套路”,比如不追求将用户圈在自己的闭环生态里,而是愿意看到用户把作品带到各大社交平台上炫耀、交流。这种开放姿态,源自他们对人与人之间灵感流动的重视,相信灵感越流动,社区越强大,公司也就越受益。这在快节奏的商业世界显得特立独行,却成就了Midjourney难以复制的社区文化和用户忠诚度。
Holz的理念为Midjourney找准战略定位提供了精神指引。前文我们分析Midjourney如何组合维度、错位竞争、定位新价值网,其实背后都有Holz理念在支撑——因为他始终认为Midjourney不应去堆砌工具功能,而要去重构维度,连接想象力 × AI技术 × 社群机制,这奠定了Midjourney的产品哲学。他也不迷恋抢占主流市场,而倾向于自下而上在边缘用户中构建共创网络,这正是价值网错位突破的起点。
Holz作为舵手,给Midjourney指明了一条与众不同的航线——不去别人已经占据的安全航道,而是驶向未知的海域,寻找全新的大陆。而这个勇气和视野,源自他对技术与人类精神如何共舞的思考和信仰。
写在最后
Midjourney之所以成为生成式AI领域最令人瞩目的项目之一,不仅因为它的模型出图质量出色,或者社区运营做得好,更因为它有一颗与众不同的灵魂。这个灵魂就是以“放大人类想象力”为信仰的核心理念。它向我们展示了一个范例:当技术与人文理想结合,可以孕育出多么强大的创造力。
Midjourney用极小的团队、极少的资源,做出了一个全球性的产品现象。它没有选择模仿主流,而是忠于理念,从边缘切入,创造了属于AI时代的想象力之路。
在这个所有人都在“AI提效”、“AI整合”、“AI平台”的时代,它却用一种接近诗的方式提醒我们:
AI,不一定非要解决问题,也可以唤醒可能。
你怎么看Midjourney的故事?
你会用它来表达你脑海里的世界吗?
欢迎留言,聊聊你的想象力。
无论是公司发展,还是个人成长,我们总是会遇到局限。
如何打破人生和事业的局限,走向更广阔的天地?
认知是解开这一问题的关键钥匙。
凯文·凯利、彼得·圣吉、尤瓦尔·赫拉利、张首晟、周其仁、俞敏洪、左晖……
混沌500多位大咖老师的智慧将与你为伴。