注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络人工智能视觉:对人类如何表示和处理视觉信息的计算研究

视觉:对人类如何表示和处理视觉信息的计算研究

视觉:对人类如何表示和处理视觉信息的计算研究

定 价:¥119.00

作 者: [美] David Marr 著,吴佳俊 译
出版社: 电子工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787121423703 出版时间: 2022-01-01 包装: 平装
开本: 16开 页数: 340 字数:  

内容简介

  本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学、视觉神经科学和心理物理学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,掌握本书介绍的视觉计算理论,对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。

作者简介

  作者:David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。译者:吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。

图书目录


第Ⅰ部分 引言和哲学基础
第1章 哲学原理和方法7
1.1 背景知识 7
1.2 理解复杂的信息处理系统16
表示和描述16
处理 17
信息处理的三个层次 19
计算理论的重要性21
J. J. Gibson 的方法22
1.3 视觉的表示框架 24
第Ⅱ部分 视觉
第2章 图像的表示 33
2.1 早期视觉的物理背景 33
图像的表示 35
基本物理假设 35
图像表示的一般性质 40
2.2 过零点和原初草图 42
过零点 42
生物学的意义 48
原初草图 54
哲学私语 59
2.3 图像的空间排布 62
2.4 光源和透明度 68
其他光源效果 70
透明70
结论 71
2.5 聚合过程和全初草图71
主要论点 75
纹理辨别的计算方法及其心理物理学意义 76
第3章 从图像到表面 78
3.1 人类视觉处理的模块化组织78
3.2 图像的处理、约束和可用表示81
3.3 立体视觉 87
测量立体视差 87
从视差中计算距离和表面朝向 121
3.4 方向选择性 124
视觉运动引言 124
利用方向选择性来分离独立运动的表面 136
渐进 141
3.5 似动 141
为什么要研究似动 142
把问题一分为二 143
对应问题 146
从运动中恢复结构 158
光流164
3.6 形状轮廓 166
一些例子 167
遮挡轮廓 168
表面朝向的不连续 173
表面轮廓 175
3.7 表面纹理 180
分离纹理元素 180
小结 184
3.8 明暗和光度立体视觉184
梯度空间185
表面光照、表面反射和图像强度 188
反射率图 189
从明暗中恢复形状191
光度立体视觉 192
3.9 明度、亮度和色彩194
Helson-Judd 方法195
关于亮度和色彩的视网膜—皮层理论196
同时对比的重要性的物理依据200
对强度非线性变化的表层起源的假设 202
测量三色图像的意义 203
本方法小结 204
3.10 本章小结 205
第4章 可见表面的直接表示 208
4.1 引言 208
4.2 图像分割 209
4.3 对问题的重新建模 211
4.4 需要表示的信息 213
4.5 2.5 维草图的一般形式 215
4.6 表示的可能形式 216
4.7 可能的坐标系 220
4.8 插值、延续性和不连续性 221
4.9 插值问题的计算 224
不连续 224
插值方法 226
4.10 其他内部计算 228
第5章 用于识别的形状表示230
5.1 引言230
5.2 形状表示引起的问题 231
评判形状表示的有效性的标准232
形状表示的设计选择233
5.3 三维模型表示235
自然坐标系 236
基于坐标轴的描述 236
三维模型表示的模块化组织 237
三维模型的坐标系 239
5.4 自然推广 241
5.5 推导和使用三维模型表示 244
三维模型描述的推导 244
以观察者为中心的坐标系和以物体为中心的坐标系的关系247
三维模型的索引和目录 247
推导和识别的交互 250
5.6 心理学的考量 253
第6章 总结256
第Ⅲ部分 尾声
第7章 对计算方法的辩护261
7.1 引言 261
7.2 一段对话261
原书第2版后记Marr的《视觉》和计算神经科学284
中文版后记从Marr的《视觉》到人类智能问题288
术语表292
参考文献 298

本目录推荐