千赢国际登录官网

千赢国际登录官网:都说开源公司赚钱难到底是为什么?

2022-09-02 16:23:35

  千赢国际登录官网:都说开源公司赚钱难到底是为什么?1980 年代兴起的开源软件运动直接或间接孕育了许多我们今天应用最广泛的软件,例如 Linux 操作系统、Chrome 浏览器、MySQL 数据库。当我们谈论开源时,它常和理想主义、互联网精神绑定在一起。在大众认知中,开源就意味着去商业化。

  直到 SaaS(软件即服务)的崛起,为开源软件创造了新的商业模式——一种有别于传统软件公司的社区共建模式。

  过去五年,开源软件的盈利从 2017 年的 114 亿美元(约合 720 亿元人民币)迅速增长到了 329.5 亿美元(约合 2080 亿元人民币)。美国通讯社 Businesswire 甚至预测,开源软件的市场规模会在 2026 年达到 668.4 亿美元(约合 4220 亿元人民币)。

  在这样的背景下,肖涵于 2020 年创建了 Jina AI——一家专注于神经搜索的商业化开源公司,并在两年之内完成了 A 轮 3000 万美元(约合 1.9 亿元人民币)的融资。

  在肖涵看来,开源和商业化并不相悖,甚至开源本身就是公司的竞争壁垒。而之所以选择神经搜索,是因为搜索始终会是一个硬需求——看似搜索已经被算法推荐弱化,但算法推荐的底层逻辑还是搜索。

  为什么说,算法推荐的底层还是搜索?开源软件到底如何商业化?一家在成立第一天就已经国际化的公司,是如何跨国协作的?

  近期,我们邀请到了Jina AI 创始人兼 CEO 肖涵,和他聊了聊这些线、传统符号化搜索只针对文本,神经搜索解决的是跨模态搜索的问题。

  2、搜索是一个非常强硬的硬需求,它可能会被上层包装,但永远不会消失。算法推荐的底层技术也是搜索。

  我们并不是要做成百度或者谷歌那样面向 C 端用户的搜索网站,相对来说我们做的更多的是一个底层的基建工作。Jina 目前的主要用户就是开发者,包括独立开发者和在公司的开发者。这些用户所在的行业非常多,从互联网到传统的保险、咨询行业都有,但主要集中在中小企业。开发者拿到我们的框架后,也需要自己构建上层应用。从某种角度上来说,我们提供了一套编程语言。编程语言非常强大,可以做很多事,但也要开发者自己写代码来实现业务逻辑。

  Jina 本身是一个开源框架,它瞄准的目标,就是利用深度学习去解决多模态和跨模态的搜索问题。跨模态指的就是跨越视觉和听觉的搜索。如果输入输出中包含了多个模态的信息,我们就叫做多模态。我们的搜索不仅仅只限于文本的匹配,还包括图片到图片的匹配,图片到声音的匹配,每一种信息形式都是一个模态。

  Jina 提供了一个编程范式,可以帮助大家很快地开发多模态和跨模态的上层应用。我们观察到的应用方向,主要有两类,文本和包括短视频在内的图片。

  拿文本来举个例子,欧洲有些创业公司会拿 Jina 的搜索框架去做长文本的阅读理解。比如说,你签了一份 50页的租房合同,里面很多看不懂的法律条文。但你最关心的可能只是「房租是多少」、「我要提前多久退房」这种问题。Jina 能做到的,就是你可以用自然语言问它,然后它可能就会以高亮的形式把相应的答案返回给你。当然这是 Jina 的一个应用方向,并不是说 Jina 已经涵盖了所有法律条文,但本质上 Jina 能做到的,就是可以快速帮助人类理解大量信息。

  很多开发者还会拿 Jina 的框架做图片、视频的搜索。相对于文本来说,它们有两个非常不同的点。

  神经搜索的处理方式,是经过深度学习后,将图片转化为特定的表征形式,再将这种表征形式和数据库匹配之后排序返回。

  以上举的两个例子,背后的架构和方法论是一致的。这就是神经搜索能够带来的最重要的一点——已有的算法和方法论可以得到复用。之前每开发一个上层应用就需要搞一套专门的方法论,但应用场景是千变万化的,就造成效率的极大浪费。

  开源公司的竞争优势不仅仅是源代码本身,而是围绕源代码的其它业务,比如增值服务。我们常说一句话,叫「基建开源,云上增值」。就是说,我们基础的技术框架是开源的,但我们会在这套基础设施上一步步地构建更高层的应用,然后在这上面实现我们的竞争壁垒。

  基建免费是说,Jina 可以很快地帮助客户搭建一套搜索系统框架,大概一个程序员两天时间就可以搭建出来。如果没有这套框架,这可能是 5-10 个程序员两三个月的工作量。并且这部分是免费的。这样就极大降低了客户从 0 到 1 的跨越成本。

  有了一套搜索系统之后,接下来客户就会考虑如何改进它,这个时候商机就来了。其实无非就是从计算、存储、分析和安全性这四个点上衍生出的一些高级特性,比如工业生产的安全性、大量的数据分析、云上的自动扩容等等,这些就是我们商业化的基石。

  我们可以用酒店大堂来理解这件事。希尔顿酒店的大堂,谁都可以免费进。但你要上楼,就必须交房费。你要是普通房客的线 层的行政走廊也进不去。

  Jina 的搜索框架就是这个大堂,底层的东西是公开免费的,但真正实现盈利的,是在上层。

  其实开源软件的生存能力,更多的不是靠代码,而是迭代速度。现在最成功的 AI 开源公司叫 Hugging Face,它本身不是什么大公司,大概在 B 轮左右。但是它有一个开源产品 Transformers,在 Github 上非常流行,有接近 6 万的 star(点赞),这个非常了不起。

  为什么没有人抄 Hugging Face 呢?你可以复制一份代码,但复制不了社区,没有人会在你复制的代码上作贡献。源代码以每天几十个版本的速度迭代,当你一个月后,发现复制的代码已经比上游的代码落后几百个版本的时候,那这个软件,其实是死的。

  我相信没有一个软件从推出第一天起就是完美的,第一个版本肯定全是 bug。但最终决定这个软件能否长久生存下去的,是你能以多快的速度消灭 bug,向下一个版本迭代。

  我是深信开源的那种人。开源不是一个宣传自己的方式,也不仅仅是一个爱好,更多的是一个经济体系。它不仅能喂饱你自己,还能营造一个市值几千亿的公司。作为商业化开源公司来说,最大的挑战,其实有三点。

  第一是如何从 0 到 1 打造一个开发者社区。当你脱去了大厂光环,一切的影响力只有通过技术本身施加。开发者本身就是一个对技术非常挑剔的群体,你只有证明你的技术确实比别人好,才能说服他们。

  当你拥有了一个规模不小的社区之后,第二个难点就是如何去深耕这个社区。良性的社区生态是一个双向的互动,既要去给予社区,也要从社区中获得反馈。不论是作为布道师还是核心代码的贡献者,只有当你和社区形成这种共生共建的生态之后,社区才能成为你的护城河。

  更难的第三步,如何将一个开源项目塑造成可以商业化的产品,它其中哪些点可以商业化?

  传统所说的搜索,其实是符号化搜索。这个概念,在计算机发明之初就存在了。包括老一辈程序员用的 DOS 操作系统下的 WPS 文字处理系统,就已经包含了搜索功能。到今天百度、谷歌的网页搜索,微信聊天记录和公众号文章的搜索,他们都属于符号化搜索。

  符号化搜索的原理就是在文本框中输入一段文字,然后逐字地扫描这个文字的值。满足一定的阈值之后,就达成匹配。

  问题在于,符号化搜索针对的场景是文本信息,但是今天互联网发展到这个阶段,信息已经慢慢从单纯的文本逐渐过渡到了图片、声音、视频、文字的多元形态。10 年前我们拿起手机刷的是新闻,今天往往就是短视频了。

  在这种情况下,传统搜索就需要给视频打标签,再通过标签来建立模态之间的联系。要实现这样的系统,无论是转化为标签,还是维护标签体系,在实际工程中是都很有挑战的。

  但是这两年 AI 技术的发展提供了一种新的搜索范式。通过深度学习模型,神经搜索可以将不同模态的数据投射到同一个向量空间,实现不同模态间的相互搜索。从结果上来说,有了 AI 的加持,不管是搜索的输入还是结果的呈现,计算机就可以做到用人类的思维表达。

  这是我觉得 AI 给搜索带来最大的改变——之前的搜索是人在适应机器,神经搜索是让机器适应人。

  Jina Hub 中提供跨模态搜索常用的 CLIP 预训练模型,开发者还可以进一步使用 finetuner 对模型进行领域适配|图片来源:Jina AI

  如果是构建像百度、谷歌这样广义的全网搜索引擎的话,那它肯定受众是最广的。但作为一个 B 端用户,要在内部使用百度、谷歌的搜索技术是非常难的。第一个是 B 端用户并不拥有百度、谷歌的技术,没法把技术部署到内部。

  第二个是,每个 B 端用户所在的垂直行业都有它特定要解决的问题,没有办法使用一个通用的解法。拿电商的以图搜图来说,一个服装电商,它的搜索模型识别的可能是衣服有没有领、是长袖还是短袖。同样的搜索引擎放到食品电商上就完全行不通,因为物品属性不一样,背后的搜索逻辑不一样,你没有办法要一碗「圆领的螺蛳粉」。

  另外,我们发现很多 B 端用户的痛点在于,不是每家都有能力自己构建一套搜索系统,因为不是每家企业都是互联网公司。通常搜索也不是他们的主营业务,它扮演的角色,其实是他们商业模式中的一环,能够帮助他们扩大利润。

  其实搜索是一个非常强硬的硬需求,它可能会被上层包装,但永远不会消失。因为当我拿到一批海量数据之后,第一步就是要理解它。然后我要去做预测、推荐,以及各种私有化的信息流。所有的这些上层应用都依赖于一个基础设施,就是能让我迅速定位到想要的某个数据,这个其实就是搜索。

  再拿智能音箱举例。当你问智能音箱「今天天气怎么样」和「今天多少度」的时候,它是怎么把这两个问题对应到同一个回答上的?实际上这个过程就包含了语义的理解和匹配,整个就是一个搜索的过程。

  我们今天看到的很多上层应用,它不一定是以文本框的形式来呈现的,但它最终依赖的底层技术,往往是搜索技术。

  首先创业肯定要具备这个领域的专业知识。我从小学就开始写程序,初中就发布了一些软件。我一直觉得自己是个极客,别人业余时间喜欢玩游戏,但我觉得没事干的时候编程可以给我带来快乐。我最早接触人工智能是在 09 年,当时人工智能还是非常早期的阶段,但我本科的毕设就是关于人工智能。包括后来去德国念博士、加入腾讯 AI 实验室、做微信的搜一搜,都在这个领域积累了很多经验。这些经验是创业的一个必需条件,不然大家不会跟随你,投资人也不会信你。

  第二个我觉得是心里要有创业的「反骨」。你的性格是愿意安稳地待在一家公司还是自己去闯一片天地?这两种没有对错之分,但我恰好就是希望去闯一闯,去构建一套体系,实现自己的想法。

  我始终觉得应该做对的事情。创业就是先落到一个有意义的事上,然后你决定投入多少未来的时间在这件事上拼搏。

  在 2020 年那个时间点,当所有的事情都串成线了,再加上一件我自己很认可,大家也觉得非常有意义的事情,促成了我选择创业。

  不会,创始人应该是个永远都不怕死的人。如果创始人再担惊受怕,那大家都没法工作了。我跳出腾讯创业的时间也挺微妙的,是 2020 年 2 月份左右,恰好是新冠疫情开始传播的时候。当时有很多的不确定性,大家的状态也都不是特别稳定。

  但是在那个时间点,一个创业者似乎感觉不到这些东西,他一定要按照自己的时间规划往前走,去达成目标。我觉得困难肯定有,但对创业者来说,总是要能想到克服困难的方法。

  肖涵:首先是我在德国已经生活了 10 年,对德国的整个创业环境和法律都比较熟悉。

  第二点的话,因为我们是一个开源公司,我们瞄准的是一个国际化的市场。那从第一天起,我们就应该是一个国际化的公司。

  具体来说,选择柏林是因为它的人才环境非常好。它首先是一个有活力的国际大都市,同时它的物价、房价都没有炒到特别高的程度。这是一个非常重要的条件,这意味着年轻人有支付能力可以在这个城市扎根,意味着这些年轻人可以跟创业公司一起成长。

  开源项目本身是一个分布式和异步式的工作,所以没有必要把所有人都聚在一起。这种方式反而有利于对吸引全球的人才,大家都有不同的背景,可以集众家所长。但是我们面临的主要问题就是怎么去统筹规划任务,能够让团队的协作模式适应不同的时区。这对管理来说是很大的挑战,如何把任务拆解,又怎么把拆解出来的成果合并到一起。

  最基本的当然是技术能力,这个不必说。同时我也会强调,加入创业公司是一个非常艰巨的任务。你自己得想清楚,为什么不去大厂,而是要加入 Jina。

  第一个是学习能力。因为在刚开始的一两个月,你要接触大量的神经搜索、云原生、开源等各个领域的知识,学习量是非常大的。我和所有的员工都会强调,只有透彻地理解这个公司的软件产品在做什么,你才能跟公司一起成长。

  第二点是对开源的理解。毕竟闭源公司和开源公司在工作方式和工作内容上都很不同。

  第三点是国际化程度。加入国际化公司不是一个福利,更多是要面临工作方式和文化交流上的挑战。

  第一个是速度。我经常跟我们的工程师说,不是不犯错,而是犯了错之后我可以极快地修复错误,以至于你甚至没发现我犯错了。那对用户来说,他们就受到的影响就很小。第二个是质量。我们不会刻意地在一开始就追求非常高的质量,而是通过不断的快速迭代,最终达到高质量。这一点非常重要,因为很多程序员是一个技术上的天才,但是对产品的把控和商业价值没有特别清晰的认识。如果每一个程序员都能把一个开源项目当成一个商业化开源产品去理解,那我们公司一定是非常成功的。

  第三个是勇敢。我希望我们的工程师可以勇于站到台上去说服别人,成为 Jina 技术的布道师。没有人比他们更适合去成为这个布道师,因为他们就是技术的创造者。

  我们的长远目标肯定是上市。如果一个创始人说他的目标不是上市,那我觉得这个创始人没有很当真。相对短期一点来说,比如最近两三年,我们的目标就是让所有人都能接受神经搜索,然后用 Jina 的搜索框架去解决它们生产生活中的问题。这个是我觉得近期内最重要的,也是我们会不断投入去做的事情。

  *以上嘉宾观点不代表 Founder Park 立场,也不构成任何投资建议。