其实现阶段的图像数据是最不利于分析的。因为图片从左到右,从上到下。渲染图片。图片的一堆二进制数字丝毫没有记录图片中物体的形状的电流走向。白背景黑体字最好识别是因为字体在计算机有电流走向记录。只要把白背景剔除。就剩下黑体字渲染的电流走向。跟计算机的字体记录匹配下就比较容易做到精准的识别。而一个水杯的电流走向根本在计算机没有记录,除非你绘制了水杯写进计算机,类似于把字体写进计算机的方法。所以,图片识别需要一种新的图片格式。不是从左到右,上到下渲染。是先渲染一个一个的形状,然后渲染背景之类的。这样图片数据本身就带有形状。就是把形状转成了电信号。不过这种格式占的数据空间估计很大。需要很多硬件的不断发展支持。用树莓派面包板led灯来实现下这种图片格式。例如,面包板上插了100个led灯,现在想显示一张蓝色背景跟水杯的图片。首先不能从上到下显示这张图片。树莓派的输出电流必须先流通这个水杯的形状,才能流进蓝色led渲染背景。所以电信号里就记录了水杯的形状。假设是10100110。因为如果从上到下显示一张图片,这些电信号根本无规律可言。无论后人的算法多牛逼,都无法突破这种限制。所以我觉得,大规模的图像识别其实没到时候,存储硬件还没到位,这种图片格式就没到时候推出来。不过白背景黑字体识别现在已经做得相当不错。
图片识别的新格式
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 看了很多方法,因人而已。两个int型变量a和b,不使用临时变量,交换它们的值。总结一下:Ca = a + b;b ...
- Given an integer array nums, find the sum of the elements...