StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩

news/2024/7/7 18:59:25

点击上方“视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达6251f59b13b55d4b7de6ea4e606b37b2.jpeg

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

注意看,你面前是一堵平平无奇的墙。

现在,你可以按照自己的意愿,让它直接凭空长出点东西来。

比如……一只小猫咪?

a0ddf05fb631326f9a6a8046df69327a.gif

没错,Stable Diffusion又可以搞新花活了!

这一次的重点在于,Stable Diffusion的触手扩展到现实世界——和WebAR相结合

作者是个软件工程师小哥Stijn Spanhove,经常在推特主页发些关于WebAR或XR的视频。

目前,这条凭空长猫的视频热度还挺不错。

75b3da38313cbf9d63028db9fd2a5f70.png

新世界的大门打开,有网友对AR+SD的兴趣更浓了:

5f0c8b86a589b73430f3686e1d13b66d.png

还有人说:

这简直就是《反恐精英》一个酷毙了的新版本啊!

7a9202f546067f7ac61de598244b1512.png

一起来看看这个有点酷的新东西吧~

SD与AR一起玩

首先,拿起手机,然后随意选择一堵墙,透过屏幕界面锁定它:

4d204455110454697edf095578e57388.jpeg

选定一块心仪区域,把它圈起来,全部涂黑。

abd8485d177ea14787f0040294989260.gif

输入提示词:

一只可可爱爱的小猫咪,涂鸦风格,数字艺术

接着点击输入框下方的Diffusion按钮,直接快进到见证奇迹的时刻。

514ced96588a34aa6a633f781dcf07b1.gif

此时,无论从哪个角度看,墙上都有一幅《喵娜丽莎》在微笑地看着你了。

这个视频,是小哥利用火到没边、门槛又低的Stable Diffusion,结合WebAR,搞出的第一个实验产品。

他在评论区和围观网友讨论了具体的工作流程

第一步,冻结帧,把它作为生成图像的表面纹理,并让它拥有世界定位和设备跟踪相机。

第二步,向服务器发送API请求,并附上冻结帧(图像)和文本提示(Stable Diffusion)。

整个工作中,将Stable Diffusion嵌入现实世界是利用AR完成的。

关于绘制纹理,小哥则使用了Raycast(一款完全可扩展的快捷启动器)。

整个过程简单利落,引发了网友新的思考。

目前有很多有趣的NPU(嵌入式神经网络处理器)硬件,手机的共享内存也超过12GB。

在这个前提下,如果Stable Diffusion和AR一起玩这个工作能在本地运行,并且能够快到在类似的请求时间内,完成整个512x512图像生成,并在更快的AI上运行升级,一定非常有趣。

a330271604d1ee046503de6b958828f0.png

小哥自己也说,这个工作只是初尝试,一切只是Stable Diffusion和AR结合的开始

但大多数网友觉得这已经是个很有趣的工作了,甚至想在上面“乱涂乱画”好几个小时。

f5573fd559d05737880a6f1dfc6b6c8d.png

AIGC打破次元壁

Stable Diffusion的风吹进现实世界,绝不是小哥一个人的想法。

具体的操作流程,基本都是在原基础上用AR加持

就在这几天,另一位小哥用Stable Diffusion,搞了个视频透视式光学透视式眼镜。

(搁这儿叠buff呢?)

具体来说,就是小哥用Stable Diffusion做了个虚拟的AR眼镜,然后在手机屏幕上透过眼镜镜片,实现AR效果。

fb6b256f83b7057d52cb8e54b66a2845.gif

生成的虚拟AR眼睛不仅有电量提示,透过它看现实,能呈现西部世界、丛林、异形等多种画面风格

此外,还有人结合Meta旗下的AR创作工具Spark AR,利用Stable Diffusion,假装自己手握了一个方块小卡片。

就是上面还能播放动画的那种。

ad16fe4bc1a6f52a3d2adc8c0450e35e.gif

为了达到逼真效果,作者还在卡片表面叠了一个反光图层,让卡片呈现的光泽“像玻璃杯一样”。

不过,这次的Stable Diffusion产出的图像不是实时生成,而是事先录制的,因为当下的Spark AR版本还不支持AI和ML。

413167d444e5c61738a57987c3d20a67.png

“Very Nice,通过Stable Diffusion,AI和AR再一次紧密相连了。”

不管怎么说,Stable Diffusion这么火,不仅靠的是跑出来的惊人结果,触及文本生成图像以外的领域时,实力也很强劲呀~

参考链接:
[1]https://twitter.com/stspanho/status/1581707753747537920
[2]https://twitter.com/ThoseSixFaces/status/1581606079380672512
[3]https://twitter.com/sergeyglkn/status/1580167837770870784

6a3815074ee68592e2945aba63c982ff.png

outside_default.png

点个在看 paper不断!


http://lihuaxi.xjx100.cn/news/256073.html

相关文章

VLAN设置错误,导致部分用户无法上网

一、事由: 单位的思科3560交换机安装到位,加班到夜里12点,测试了一下,怎么有些用户PING不到了呢?难道集体关机了吗?太累了,准备明天处理。二、问题: 第二天早上&#xff0…

2018.5.29 Oracle连接到空闲例程

解决方法如下: 1、通过cmd命令窗启动Oracle:(最好是以管理员身份启动) C:\Users\Administrator>sqlplus /nolog SQL>conn /as sysdba 或者这种 conncet sys/123456orcl as sysdba //sys是用户名 123456是密码 。 后面的是数据库名字 SQL>s…

介绍一个打怪升级练习 Python 的网站,寓教于乐~

作者 | 周萝卜来源 | 萝卜大杂烩这是一个学习 Python 的趣味网站,通过关卡的形式来锻炼 Python 水平。一共有 33 关,每一关都需要利用 Python 知识解题找到答案,然后进入下一关。很考验对 Python 的综合掌握能力,比如有的闯关需要…

Swift解读专题四——字符串与字符

2019独角兽企业重金招聘Python工程师标准>>> Swift解读专题四——字符串与字符 一、引言 Swift中提供了String类型与Characters类型来处理字符串和字符数据,Swift中的String类型除了提供了许多方便开发者使用的方法外,还可以与Foundation框架…

机器学习神器Scikit-Learn保姆教程!

Scikit-learn是一个非常知名的Python机器学习库,它广泛地用于统计分析和机器学习建模等数据科学领域。建模无敌:用户通过scikit-learn能够实现各种监督和非监督学习的模型功能多样:同时使用sklearn还能够进行数据的预处理、特征工程、数据集切…

顶刊大改革:别只给“接收/拒绝”,咱把同行评审内容一块亮出来

点击上方“视学算法”,选择加"星标"或“置顶”重磅干货,第一时间送达金磊 Pine 发自 凹非寺量子位 | 公众号 QbitAI一个顶刊,要颠覆科学出版的“游戏规则”了。就在今天,生物学期刊eLife官方宣布了一个重大决定&#xf…

Jmeter(二十九)_dotnet搭建本地接口服务

这里使用的服务名为Bookshelf,在github上,自行下载。要运行此服务,需要.Net Core SDK 2.1或更高版本。如果尚未安装,从.Net Core官方网站下载并安装。 在本地克隆项目后,在命令行工具中打开项目文件夹并运行“dotnet r…

spring-kafka之@KafkaListener单条或批量处理消息

欢迎关注方志朋的博客,回复”666“获面试宝典来源:https://blog.csdn.net/ldw201510803006/article/details/116176711消息监听容器1、KafkaMessageListenerContainer由spring提供用于监听以及拉取消息,并将这些消息按指定格式转换后交给由Ka…