最近领导让研究一下猜画小歌的底层原理,下面是自己总结的,不合适的地方,请大家留言指点,谢谢!
1.简化图形文件:将数据定位并缩放到256x256区域。数据以ndjson格式导出,其元数据与原始格式相同。
(相关资料图)
简化过程是:
1.1.将图形与左上角对齐,使其最小值为0。
1.2.均匀缩放绘图,最大值为255。
1.3.以1像素间距重新采样所有笔划。
2.使用Ramer-Douglas-Peucker算法简化所有笔划,epsilon值为2.0
Ramer-Douglas-Peucker算法:转下一页PPT
3.二进制文件(.bin)
简化的图纸和元数据也以自定义二进制格式提供,以实现高效压缩和加载。
4.Numpy位图(.npy)
所有简化的图纸都以numpy .npy格式渲染成28x28灰度位图。可以使用np.load()加载这些文件。这些图像是从简化数据生成的,但是与图形边界框的中心对齐,而不是左上角。
5. Sketch-RNN QuickDraw数据集
该数据还用于训练Sketch-RNN模型。 Magenta项目中提供了该模型的开源TensorFlow实现(链接到GitHub repo)。您还可以在此Google研究博客文章中阅读有关此模型的更多信息。数据以适合输入到递归神经网络的格式存储在压缩的.npz文件中。
在该数据集中,从每个类别中随机选择了75K样本(70K训练,2.5K验证,2.5K测试),使用ε参数2.0进行RDP线简化处理。每个类别都将存储在自己的.npz文件中,例如cat.npz。
键类型描述
KEY_ID64位无符号整数所有图纸的唯一标识符。
字串提示玩家绘制的类别。
认可布尔这个词是否被游戏识别。
时间戳约会时间绘图创建时。
国家代码串播放器所在的双字母国家代码(ISO 3166-1 alpha-2)。
画画串表示矢量绘图的JSON数组
12月16日,国家能源局发布1-11月份全国电力工业统计数据。截至11月底,全国累计发电装机容量约251亿千瓦,同比增长81%。其中,风电装机容更多
2022-12-20 08:59:521-11月,全社会用电量同比增长,城乡居民生活用电量保持两位数增长;发电装机延续绿色发展趋势,发电量增速有所放缓;除太阳能发电外,其更多
2022-12-20 09:04:12记者从国家发展改革委了解到,目前,全国能源供需总体平稳有序,人民群众温暖过冬能够得到有效保障。 从煤炭生产看,1—11月份,全国原更多
2022-12-20 09:01:19近日,受寒潮天气影响,我国大部分地区出现剧烈降温,能源保供进入迎峰度冬关键期。能源大省山西深挖增产潜力,煤炭产量、电力外送规模、更多
2022-12-20 08:59:1512月18日下午,煤炭钢铁行业交流机制工作会在广东省珠海市召开,中国煤炭工业协会、中国钢铁工业协会、中国煤炭运销协会,山西焦煤、山东更多
2022-12-19 14:02:1412月17日,中国焦煤品牌集群高层领导座谈会在广东省珠海市召开。龙煤集团党委书记、董事长王佳喜,淮北矿业集团党委书记、董事长方良才,更多
2022-12-19 14:08:28盘江股份董事长朱家道12月15日在业绩交流会上表示,公司尚未释放煤炭产能约500万吨,将通过改善生产条件等方式方法,尽快释放产能,提升原更多
2022-12-19 10:08:24内蒙古自治区统计局消息,1-11月份,全区规模以上工业企业原煤产量107亿吨,同比增长121%,保持了今年以来两位数增长的态势。从当月情况看更多
2022-12-19 09:54:45今年以来,福建八方港口积极调整经营思路,多举措拓展内贸煤市场。截至11月30日,港口完成内贸卸船量3047万吨,同比上涨1112%,比去年全年更多
2022-12-19 10:12:07为了最大限度地减少疫情对经济社会发展影响,近日,吕梁市出台支持工业企业加快复工复产达产达效15条措施,促进全市经济快速回升向好。 更多
2022-12-19 10:04:25