今天又是把手画残了的一天

近期，使用各种生成模型的同学们发现，在使用Stable等衍生模型时，存在一个普遍的问题：手画残了。这个问题的主要原因有如下三点。

首先，CLip模型使用的是ResNet50/100和ViT14/16/32等模型来分析图像的结构，一般选择后者。但这些模型作为transformer应用方法，实际上是将图像切成块，然后丢到多头模型中进行处理。然而，图像的每个小区域需要保持连贯性，而切块会破坏这种连贯性。因此，对于复杂的图像，如手和路牌等，切块是不友好的，特别是没有描述信息的部分。

其次，数据本身描述的有用信息较少。照片一般描述主题，而对于细节部分的描述有限。例如，图片描述中很少包含是否有手、手在哪里等信息。

最后，提高分辨率有助于减少手画残的几率。然而，使用来跑Stable等模型的机器的性能往往非常有限。

今天又是把手画残了的一天

乌军F-16西部升空巡逻，俄军SU-25失去保护被击落

运营公司就“雁荡山游客攀岩拥堵挂半山腰”致歉：暂停售票

男子花62元中双色球1.48亿元，没戴头套领奖，这回大家该相信了吧

2024年5月6日外交部发言人林剑主持例行记者会

郭宁宁任福州市委书记

形势极其严峻，多操心未来的日子怎么过吧！

反击！滕哈赫：除了穆里尼奥，曼联主教练没有得到他们想要的球员

国乒再爆大冷！王曼昱1-3巴特拉，无缘16强，或丧失奥运单打资格

网络红人项立刚反驳丘成桐，网友：一个高等数学不及格的人怎敢？

理想汽车无人驾驶一路狂奔副驾还坐着未系安全带小孩

香飘飘硬刚日本核污水？反转来的太快

1-2！辽篮陷绝境，杨鸣被指不如乌戈，最大悬念：郭艾伦能否复出

五一超800万人次出入境较去年同期增长35.1%

离岸人民币兑美元跌超200点

雷军逛北京车展后表示很绝望，称“车企做产品全靠蒙”

抢镜！广东球迷穿徐杰怒吼T恤，嘲讽张镇麟，朝辽篮球迷放儿歌

深圳分区优化住房限购政策

店铺回应卖出的叫花鸡里没有鸡:临时工把样品给打包了

外国游客吐槽APP成畅游中国的"拦路虎" 上海参事发声

中柬两军将举行"金龙-2024"联合演习

今天又是把手画残了的一天

乌军F-16西部升空巡逻，俄军SU-25失去保护被击落

运营公司就“雁荡山游客攀岩拥堵挂半山腰”致歉：暂停售票

男子花62元中双色球1.48亿元，没戴头套领奖，这回大家该相信了吧

2024年5月6日外交部发言人林剑主持例行记者会

郭宁宁任福州市委书记

形势极其严峻，多操心未来的日子怎么过吧！

反击！滕哈赫：除了穆里尼奥，曼联主教练没有得到他们想要的球员

国乒再爆大冷！王曼昱1-3巴特拉，无缘16强，或丧失奥运单打资格

网络红人项立刚反驳丘成桐，网友：一个高等数学不及格的人怎敢？

理想汽车无人驾驶一路狂奔 副驾还坐着未系安全带小孩

香飘飘硬刚日本核污水？反转来的太快

1-2！辽篮陷绝境，杨鸣被指不如乌戈，最大悬念：郭艾伦能否复出

五一超800万人次出入境 较去年同期增长35.1%

离岸人民币兑美元跌超200点

雷军逛北京车展后表示很绝望，称“车企做产品全靠蒙”

抢镜！广东球迷穿徐杰怒吼T恤，嘲讽张镇麟，朝辽篮球迷放儿歌

深圳分区优化住房限购政策

店铺回应卖出的叫花鸡里没有鸡:临时工把样品给打包了

外国游客吐槽APP成畅游中国的"拦路虎" 上海参事发声

中柬两军将举行"金龙-2024"联合演习

理想汽车无人驾驶一路狂奔副驾还坐着未系安全带小孩

五一超800万人次出入境较去年同期增长35.1%