珠海业勤税务师事务所有限公司珠海业勤税务师事务所有限公司

作家许地山简介,许地山简介资料

作家许地山简介,许地山简介资料 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器(qì)人ChatGPT火爆以来(lái),微软公司(sī)创始人比尔(ěr)·盖(gài)茨已多次公(gōng)开(kāi)谈论人工智能话题。在最近的一次采访(fǎng)中,他(tā)再次表示(shì):“AI可能会(huì)让(ràng)科(kē)技行业迎来一(yī)次剧烈的洗牌”。

这个(gè)结论是他在当(dāng)地时间2月20日接受《In Good Company》节目专(zhuān)访(fǎng)时提出的。

他预期,AI的(de)发(fā)展可能会威胁到谷歌的市占率,因为微软(ruǎn)在AI方面的行动相当迅速。而最终(zhōng)科技巨头将把AI整合(hé)成用户的“全能助手(shǒu)”,包(bāo)揽一切应用,与人(rén)们进(jìn)行沟通并提供建议(yì),可以(yǐ)取代(dài)亚马逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的到(dào)来可能尚需(xū)时日,但由ControlNet引发的又一次(cì)AI绘(huì)画(huà)浪潮,让AIGC在(zài)ChatGPT的话题热点包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期(qī),将洗牌(pái)科技行(xíng)业?_黑料正能量

01

ControlNet颠覆(fù)AI绘画(huà)新(xīn)玩法

AIGC向可(kě)控靠近

以AI绘画(huà)为代(dài)表的AIGC上一次(cì)爆(bào)火(huǒ)的时候(hòu),还(hái)是2022年(nián)8月(yuè),在(zài)美国科罗拉多州(zhōu)举办的(de)新兴数字艺术家竞赛中,一(yī)幅名为《太空歌剧院》的作品获奖。

随后各大厂商(shāng)的AI绘画软件(jiàn)被广大网友熟知并体验(yàn),Stable Diffusion便是(shì)其(qí)中代表。

ChatGPT之(zhī)后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能量

用户们可(kě)以在应用中输入一(yī)组关键词或(huò)者一张照片,就能获(huò)得一幅AI创作的画作。

作(zuò)画(huà)的关键就是所(suǒ)输入的文本。同(tóng)一(yī)组关键(jiàn)词也可以创(chuàng)作出很多张风格不一(yī)样的(de)画作,这让创(chuàng)作的过程就(jiù)像(xiàng)开盲盒。

很多用户很(hěn)喜欢这种不确定(dìng)的惊喜(xǐ),他们会将生成的美图当做头(tóu)像。而另一(yī)部分喜欢(huān)翻看AI绘画的(de)“翻车”作品。在(zài)社交媒体(tǐ)上,许多用户分享AI“翻(fān)车现场”,例如,一位网(wǎng)友的(de)小狗(gǒu)照(zhào)片被AI画(huà)成(chéng)了“肌肉男”,还有网(wǎng)友的个人照片(piàn)被AI识别成了建(jiàn)筑(zhù)。

而(ér)如今随着ControlNet的出现与加持,以往AI绘画(huà)的填(tián)写关键词游戏可能要被颠覆(fù)了。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能(néng)量

ControlNet是一位正在斯(sī)坦福读(dú)博的(de)中(zhōng)国人张(zhāng)吕敏创(chuàng)作的一种基于控制点的图(tú)像变形算法,主要用于数字图像处理、计算(suàn)机视觉和计算机图形学等领域。

其SD插件一经发布,在短短的两(liǎng)天内便(biàn)成为(wèi)了AI绘画领域最新的(de)热(rè)点。

在(zài)此之(zhī)前,大家(jiā)用了很多方法想(xiǎng)让AI生(shēng)成的结果尽(jǐn)可能的(de)符合要求,但是(shì)都不尽如人(rén)意,它的(de)出现代表着AI生(shēng)成开始进入(rù)真(zhēn)正的(de)可(kě)控时(shí)期。

因为ControlNet可以直接(jiē)提(tí)取(qǔ)画面的(de)构图,人物的姿(zī)势和画面(miàn)的深度信息等。有了它的帮助(zhù),就不用(yòng)频繁的用提示词(cí)来碰运气,抽盲盒式的创(chuàng)作了。

通俗(sú)的说ControlNet相当于给AI绘画加了(le)“魔(mó)法”,不少博主的作品(pǐn)已经获得了大量的浏览量,“viggo”就是其中之一,他(tā)用朋友(yǒu)的(de)照片直接带(dài)她们(men)走(zǒu)进动漫世(shì)界。

ChatGPT之后又一(yī)应(yīng)用杀(shā)疯了,AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑(hēi)料(liào)正能量

viggo先用StableDiffusion图片转文字。

再(zài)用Text2Prompt插(chā)件拓展找到(dào)对应的关键词;最后用(yòng)ControlNet插件绑定骨骼开始换关键词试效(xiào)果。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入(rù)可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能(néng)量

通过(guò)图片就可以看出来(lái),效果十(shí)分惊艳。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料正能(néng)量

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌(pái)科技行业?_黑料正能量

更厉害的是,除了真实(shí)的照片,草图也可以加上“魔法”,知乎(hū)大牛“DevPoint”和(hé)“逗砂”介绍到(dào)ControlNet还(hái)能实现线稿转全彩图。大神张吕敏其本(běn)尊也(yě)亲(qīn)自(zì)回应。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量(liàng)

不(bù)得(dé)不说(shuō)当(dāng)下AIGC已经变(biàn)得越来(lái)越强大,甚至输出的作品都已经能以(yǐ)假乱(luàn)真(zhēn)了。

02

难辨虚实,AIGC技(jì)术力爆(bào)发

警惕安全问题

近(jìn)日,“苏州(zhōu)金鸡湖有游艇party”的消息(xī)火遍(biàn)网络,而经过警方辟谣这所谓的“party”可(kě)能是全国第一起(qǐ)AI绘图诈骗(piàn)。

由于(yú)这个(gè)活动里面(miàn)给出(chū)的美女照片都是AI制(zhì)作的真人照片绘图(tú),因为太逼真(zhēn),被大(dà)家当(dāng)成(chéng)真事传播了(le)

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

不过仔细观察(chá)可以发现,活动发(fā)起(qǐ)者提供(gōng)的照(zhào)片(piàn)中有个(gè)很(hěn)大(dà)的漏洞可以(yǐ)发现并非(fēi)真人(rén),而是AI绘图,那便(biàn)是图片中女性的手(shǒu)指部分有的存(cún)在(zài)异常。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

有行业人事表(biǎo)示:“现在(zài)因为(wèi)手指部分(fēn)的绘画(huà)算法比较复杂,AI还(hái)不太(tài)会(huì)画(huà)人的手(shǒu),但最新看到的图片已经有越来越完美的AI模(mó)型出(chū)现,以后可能(néng)就完全(quán)没有漏洞了。

类似的AI作图诈骗在国外也已(yǐ)有发生。据英国广播(bō)公司报道,土(tǔ)耳其地震期间,有(yǒu)Tiktok用户使用AI合成了(le)儿童受灾(zāi)的假照片发布到(dào)网络,以此诱(yòu)骗善良的人打赏“捐助(zhù)”从(cóng)而实施诈骗。

目前(qián)随着技术发展,AIGC已经能做出(chū)真(zhēn)人照片般的绘图效果(guǒ),如(rú)果(guǒ)这样的图片被用来(lái)诈(zhà)骗(piàn),将(jiāng)非常(cháng)可(kě)怕。

此外AIGC还引发了(le)很多担忧(yōu),一(yī)方面,批判者认为(wèi)AI在“学习”了大量前人的作(zuò)品之后,其创作(zuò)没有(yǒu)任何(hé)情绪和(hé)灵魂(hún),难以和人类的艺术创作相(xiāng)提并论。

另一方面(miàn),AIGC背后的(de)版(bǎn)权(quán)、目前都并没有得到(dào)有(yǒu)效(xiào)的解(jiě)决,还(hái)有AIGC会不会代替(tì)人(rén)类“至高无上”的创意。

马斯(sī)克(kè)也强调,人工(gōng)智(zhì)能的(de)安全问(wèn)题需要得到重视(shì),太晚就来(lái)不(bù)及了(le)。

03

AIGC下一站除了(le)视(shì)频,还有远方

技术都是有两面性的,潜在的(de)危害并不能掩盖其光辉(huī)的贡(gòng)献。现在看来,人工智能技术将是第四次工业革命(mìng)的核心驱动力量,将创造新(xīn)的增长奇(qí)迹。

过去一年,人(rén)工(gōng)智能在技术和商业层面都有了巨大进(jìn)展,AI绘画就是人工智能技术发生方向性改(gǎi)变(biàn)的一个(gè)代表(biǎo)。其下一站或(huò)许就是视频。

此(cǐ)前,Meta和谷歌先后发布了几条引爆(bào)科技圈的(de)短视频。这(zhè)些视(shì)频引发关注并非内容做得(dé)多优秀,反而都(dōu)非常简单,比如一匹正在喝水的马,一只画画的玩(wán)具熊,或者一段骑摩(mó)托(tuō)车(chē)的第一视角(jiǎo)录(lù)像,随便一个有手机(jī)的人(rén)都可以(yǐ)随手录下一段。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯(fēng)了,AIGC或(huò)进(jìn)入(rù)可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

但这些(xiē)短视频(pín)的创(chuàng)作方式非常简(jiǎn)单,创作者仅仅(jǐn)需要向AI输入一段话,甚(shèn)至只是说一下要求,AI就可以(yǐ)根据(jù)需要生成一段视频。

谷歌发布的两个AI生成视频分别来自于Imagen Video和(hé)Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多(duō)的差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视频后(hòu),AI圈就(jiù)已(yǐ)经玩了一波梗(gěng),一个能够做出(chū)更高清视频的AI还不足以作家许地山简介,许地山简介资料在短时间内戳中兴奋(fèn)点。

Phenaki更加令人震(zhèn)惊的地(dì)方(fāng)在于,它可以(yǐ)制作(zuò)出超(chāo)过2分钟的连(lián)贯的也有确切内容的(de)视频,这(zhè)才是真正让人们感到(dào)惊喜的地方(fāng)。因(yīn作家许地山简介,许地山简介资料)为无论AI生成的视频多(duō)么高清,也只能是为内(nèi)容生产者提(tí)供一个灵感,一个素材,一(yī)个过场动画。

不过能够制作出有具体(tǐ)剧情内容的视频(pín)就(jiù)意味(wèi)着,一些视频创作由AI代(dài)替人工完成已经初步有(yǒu)了可(kě)能。

当下AI的发展速度已经(jīng)超过大部分(fēn)人的想象。内容产(chǎn)业的(de)本质是供给创造需求,AIGC作(zuò)为全新的内容生(shēng)产方式,可以为内(nèi)容产业带来更新(xīn)的内容(róng)风格、更快的(de)生产速度,更低的生产成本,这(zhè)无疑会驱动内容(róng)产业的大爆发。

除了AI绘图、视频,AIGC技(jì)术还能应用(yòng)于音乐、代(dài)码、机器(qì)人动作(zuò)等多(duō)种内容(róng)形(xíng)式的(de)生成。不难发(fā)现该项技(jì)术不仅在游戏等行业(yè)能得到有(yǒu)效应用,对于下一代互联网(wǎng)各种元素(sù)的构建(jiàn)亦(yì)有关键(jiàn)意义。

从商(shāng)业化的角度来看,文化娱乐、教育、传媒(méi)等诸(zhū)多(duō)领域,本身就对基于AI的可视化内(nèi)容有(yǒu)强烈需求。

因此,AI绘画及视频(pín)或不是结果,而只是(shì)AI进程中的一块重要拼图(tú),有望在(zài)技术更(gèng)新的加持下实(shí)现更大的(de)应(yīng)用价值(zhí)。

AI从理解内容,走(zǒu)向(xiàng)了可(kě)以(yǐ)生成内容,甚至能够(gòu)创造出独立价值(zhí)和独(dú)立视角(jiǎo)的内容。AIGC的再次出(chū)圈,更(gèng)代(dài)表着(zhe)未来的先进生产力(lì)即将到来(lái)。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入(rù)可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

04

紧抓(zhuā)大模型与算力,牢固AIGC底座

从技术的发展也可以看(kàn)出,在语言大(dà)模(mó)型(xíng)、图像大(dà)模型之后,多(duō)模(mó)态大模(mó)型已经成为了(le)新的趋势。

大模(mó)型被(bèi)誉为当前(qián)人工智(zhì)能发展的智能底座,是(shì)全(quán)球竞争(zhēng)最激烈的研究方向之一,包括谷歌、亚马逊、百度、阿里、腾讯等众(zhòng)多头部(bù)企业都在竞(jìng)相发力。

不过训练大模型的确(què)价格(gé)不菲,以国盛证券(quàn)发(fā)布的《ChatGPT需(xū)要多少算(suàn)力》报告(gào)估算,GPT-3训练一次的成本(běn)约(yuē)为140万美元。而对于一(yī)些更大的LLM(大(dà)型语言(yán)模(mó)型),训(xùn)练成本则(zé)介(jiè)于200万美(měi)元至(zhì)1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的独立访客平(píng)均数1300万计算,其对应芯片(piàn)需(xū)求为3万多片英伟达(dá)A100 GPU,初始投入成(chéng)本约为8亿美元,每日仅电费(fèi)就在5万美元左右。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科(kē)技(jì)行(xíng)业?_黑料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力支持。在关注各类大模型的(de)发展同(tóng)时,更应(yīng)该关(guān)注(zhù)算力网络的建设。

算力(lì)网(wǎng)络正驱动AI产(chǎn)业(yè)发展进入史诗级加速进程(chéng),让AIGC及通用AI这一人工智能发展的终(zhōng)极目(mù)标离(lí)得(dé)更近。

因为算力可以对(duì)突(tū)破性技术创(chuàng)新提供大力的支持(chí)。这方(fāng)面,多模(mó)态大模型是典型。作为面向(xiàng)未来强人工智(zhì)能(néng)、通用人工智能(néng)的重要技术创新,多模态大模型已经在人工智能领域提出了(le)很(hěn)多年,业界也有不(bù)少技术突破,但是,多(duō)模态大模型(xíng)进一(yī)步(bù)往下走(zǒu),算(suàn)力需求呈几何式(shì)上升,一(yī)般的(de)算力基(jī)础设施很快(kuài)将难(nán)以胜(shèng)任(rèn)。

从图像、文(wén)字、语音单独一项的训(xùn)练,到(dào)双模态、三(sān)模(mó)态(tài)的跃迁,让人工智能可以(yǐ)灵活应对不同模态的转(zhuǎn)化、像人与世界交互一样自然(rán),这方面,由算力网(wǎng)络来驱动将有明显优(yōu)势。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期(qī),将洗牌科技行(xíng)业?_黑料正能量

此外,还(hái)有很多(duō)需(xū)要(yào)爆发式增长的算力(lì)来支撑的技(jì)术创新,将在人工智能算力网络支撑下快速推(tuī)进(jìn)。

AIGC已经露出(chū)曙光,期待(dài)在大模型和大算力的支持下(xià)AIGC能持续颠覆内容生(shēng)产的方式,将创造的边际成本(běn)降(jiàng)低,让万众(zhòng)受益。

未经允许不得转载:珠海业勤税务师事务所有限公司 作家许地山简介,许地山简介资料

评论

5+2=