金字塔结构逻辑运用二值脉冲对简单图形处理

引用本文
王上. 金字塔结构逻辑运用二值脉冲对简单图形处理. 自动化学报, 2022, 48(2): 615−626 doi: 10.16383/j.aas.c190619
Wang Shang. Pyramid structural logic using binary pulse for simple graphics processing. Acta Automatica Sinica, 2022, 48(2): 615−626 doi: 10.16383/j.aas.c190619
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190619
关键词
元胞自动机,
金字塔结构,
布尔逻辑,
脉冲,
延时继电器
摘要
本文根据元胞自动机模型划分方法, 将二维图像分解为2×2矩阵单元结构. 提出了几种逻辑运算式, 用以分类由黑白二值点构成的2×2矩阵图形. 通过CNN神经网络的多层结构形式, 分析了金字塔结构逻辑在相似的组合形式下, 对二值图形边缘检测和池化的功能. 通过同步脉冲形式能将灰度图像, 分解为多个时间维度的二值图形, 方便多层金字塔逻辑运算处理. 分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性. 讨论了3×3输入金字塔模型, 在不规律脉冲情况下, 通过逻辑运算对线性交点检测的可能.
文章导读
从大禹采取疏导治水的方法, 到排水系统, 再到化工流体设计; 从踏板纺织机, 到吉姆斯·瓦特的离心调速器, 再到机械臂; 从算盘, 到布莱斯·帕斯卡尔等的齿轮驱动计算, 再到William Shockley等的晶体管电路[1-7]. 前述的或相似的, 每种方法或设备的运用, 都为人类生产、生活带来巨大效率提升及能耗降低. 这些进步都源于各位先贤对事物自然规律更加深刻的认知及巧妙运用. 有时进步是新的自然规律发现及应用; 有时进步是多种事物根据自身不同规律, 按照特定流程巧妙地组合为的复杂系统[8]. 复杂系统按照时间顺序自动化运行, 从而完成目标任务. 人类创建的自动化运行的复杂系统, 除了由人按自身心理、行为规律构建的社会系统[9], 还有由物体构建的各种自动化系统[5].
目前的计算机是在冯·诺依曼体系结构[10]下, 按照脉冲时间顺序,进行二进制布尔运算[7]的电子自动化系统. 计算机不仅能按人类给定的程序, 高效完成各种复杂的十进制数学运算, 还能模拟事物的自然变化规律, 甚至能构建一个虚拟的平行系统[11]. 在虚拟平行系统里, 人们不仅可以完成各种图形图像的产品和工程设计, 还能创造出比现实更美妙的音乐及影像作品. 计算机对图像处理和图像识别的应用, 催生出各种算法进行数据分析处理. 边缘检测是图像分析处理的第一步, 主要是为提取图像中形状这一重要特征信息[12-13]. 边缘检测也是视觉通过水平细胞抑制作用处理图像的重要步骤[14]. 边缘检测后, 图像会生成很多线性交点. 如果这些交点作为特征点, 应该会在图像识别、图形定位、三维重构中有较大应用价值. 由于目前的图像边缘检测在视角和光照变化影响下交点位置变化较大, 边缘检测最大缺点是对纹理和图像层次信息损失非常大.
1980年, Fukushima根据生物学家Huble 和 Wiesel 的层级模型,发明了由输入层、卷积层、池化层、全连接层及输出层构成的CNN 神经网络[15]. CNN神经网络,使得原有的机器学习方法下的图像识别技术取得重大进展. 然而, 机器学习和图像处理算法, 并不符合动物记忆特性, 也不符合计算机的布尔运算规则. 图像学习和处理过程中, 需要消耗大量的数据资源和计算资源. 目前, 符合计算机布尔运算的并在CAD等平面设计软件中应用的, 二维图形处理算法, 是基于交点遍历的算法和简单片链算法[16-17].
早在20世纪40年代末, 冯·诺依曼就提出了适合大型并行运算且符合布尔逻辑运算的元胞自动机模型方法[18]. 随着时间推移, 在众多研究者的努力下,
元胞自动机发展出类似于数学形态学腐蚀、膨胀的布尔逻辑规则用于图像处理[19-23]. 该规则除了采用原有的边缘检测用于二值图像的处理, 还采用坐标逻辑把灰度图像分解成多个不同坐标系的二值图像, 两者用CA并行处理, 获得了很好的实验结果[19,

图

图

图
金字塔结构逻辑阵列不仅能高效、可靠地对具有二值特性的图形进行边缘检测、扩散. 金字塔结构逻辑构成的二值图形, 还能通过规则抽样池化的方法, 较为准确地形成多个相似图形, 并且能有效缩小二值图形. 同步脉冲方式, 能将灰度图像处理为不同时间维度的多个二值图形. 该方法较大限度地保留了灰度图像的信息, 按时间顺序逻辑处理后, 经过单位时间统计, 能得到灰度边缘, 但仍然有部分信息损失. 金字塔结构逻辑输入路径上加入延时继电器, 在组合金字塔结构下, 对图形具有一定的记忆特性. 不同输入刺激, 产生不同组合金字塔结构性记忆. 这种记忆模式不是很稳定, 也不易被提取, 更加难以局部复制, 否则会导致混乱.
本文所述的方法, 便于计算机程序模拟实现, 且方便整体复制, 但是运行效率会比通过电子电路实现效率低. 电子电路实现的难点, 在于带有计数功能的可变延时继电器大规模、小型化的实现和脉冲同步性的协调, 更重要是它难以被标记和复制信息. 本文的方法, 还有很多不足和未考虑到部分, 期望下一步, 能进行实质性应用探索和更深入细致研究.
作者简介
王上
重庆中容宏策机械设备有限公司天然气撬装工程师. 主要研究方向为天然气液化工艺,
自动控制.
E-mail: