图森互联首席技术官侯小迪：用5行代码征服一个地区

最专业的游戏租号账号交易平台源码！

资讯热点

当前位置：首页 > 行业动态 > 图森互联首席技术官侯小迪：用5行代码征服一个地区

发布时间：2019-4-7 分类：行业动态

最近，有很多关于自动驾驶的新闻，比如沃尔沃Uber联合驾驶，福特和Uber争相发布无人驾驶商业时间表，comma.ai开源，特斯拉的第一次汽车驾驶致命事故……所以我们也可以看到汽车驾驶的热情，这看起来像未来的业务，但我们知道这项技术离我们有多远吗？最近，图森互联公司正式宣布。三方将与北本研究所和北京理工大学在基于计算机视觉技术的自动驾驶领域展开合作。是国内第一家联合开发重型卡车，特别是军用重型卡车自动驾驶技术的科技企业、汽车企业和大学。图森互联公司负责开发计算机视觉和深入学习算法，以提供自动驾驶解决方案。InfoQ有幸采访了联合创始人侯晓迪（音译）图森互联网首席技术官。这个访谈在周末之前仍然在传达问题摘要，周末之后，我收到了回复。当我看到答案的第一种感觉是它非常严格，我也可以从一个小地方看到个人的高效风格。侯晓迪于2003年加入上海交通大学，大三时发表了被高度引用的论文；加州理工大学计算机与神经病学博士；计算机视觉与认知科学专家。建立了基于频域的视觉注意机制理论。这是近10年来对视觉注意机制最有影响的研究。显著性检测：电子残差法（发表在cvpr上），图像特征：突出显示稀疏显著区域（发表在ieee Transactionson Pattern Analysis和Machine Intelligence上）是计算机视觉领域引用最多的作者。InfoQ：你在大三时发表的论文使你成为中国人工智能青年学者单篇论文中被引用最多的人。据说他们甚至超过了许多著名的大学教授。你怎么能在这里讲这个故事？侯小弟：报纸第一次提交的最大原因一定是运气好。学术会议上的论文审查随机性太高，即使是像CVPR这样的顶级会议。评论家们从报纸上听到了太多的血泪故事（当然，他们也亲身体验过），如果他们彼此不同意。这篇文章之所以被高度引用，主要是因为它简单有效。整个算法只有5行代码，这可能是CVPR历史上最短的代码。我的五行代码是直接写在纸上的，复制下来要花一分钟的时间才能得到好的结果（截至2012年，算法的精度是公共基准的TOP3），这是你自然喜欢使用的。对于本科生课程的高水平论文，我们所要做的就是全心全意地投入到极致。从2006年到2008年毕业，我一直过着这样的生活：在实验室吃饭和生活；跳过除体育以外的所有文化课程；每天工作超过16个小时，没有假期；每天独自吃饭和走路，或与我的实验室同学讨论，我的世界仅仅是关于视觉计算原理。InfoQ：你在加州理工大学完成博士学位后，是什么促使你开始创业？侯小迪：对我来说，创业是在博士开始的时候决定的。希望我能利用更先进的生产关系，突破玻璃天花板，解决一些学术界自身无法解决的问题。对于局外人来说，加州理工学院是标准教师的摇篮。但事实上，沐浴在加州首都阳光下，受到学校内部跨学科合作浪潮的启发，我们毕业生创业的比例非常高。例如，在我的计算神经系统系，过去三年20个学生中有四个选择毕业后直接创业。InfoQ：在基于图片的嵌入式本地广告服务上，有什么困难？您对图像识别SaaS未来的技术趋势有何看法？侯小迪：实验室的工作和产品的工作有很大的不同。在媒体渲染中，每个人都认为深褶是一个已经解决的问题。事实上，去褶效果很好，而且很容易使用。它们大多与ImageNet分类问题相似（分类清晰，培训数据量大，是整个图片唯一的标签）。在实践中，我们经常会遇到训练数据不足、训练和测试数据差异过大、类别不平衡、班间差异过小、对应多个标签的地图、图片中的小对象，这些对外行来说似乎无关紧要，但对分类结果会产生重大影响。F去褶。这就导致了产品经理们每次都会提出一个新的问题，算法工程师们需要进行各种定制，以使去褶运行取得良好的效果。在这方面，我们的最终目标是允许产品经理拖动鼠标并部署Tucson的深入学习系统。所以Tucson的SaaS平台看起来平淡无奇，但实际上它包含了很多算法自适应黑技术。InfoQ：图森汽车识别的准确度是多少？您是否考虑过开源框架和开源数据集？侯小迪：在我们自己的数据中，车辆识别的准确率约为97%。图森一直积极参与开源。我们的首席科学家王乃岩是mxnet的核心成员之一（目前是最先进和最快的开源深度学习框架）。我们与MXnet合作了很长时间，提交了大量开源代码，这是MXnet最大的贡献者。InfoQ：激光雷达和非激光雷达的优缺点是什么？它们在可靠性上有什么不同？图森是怎么选择的？侯小迪：信息量不是负数，加上任何传感器都不会有帮助。即使信息可以通过其他渠道获得，也能起到连接后的交叉检查和降噪作用。通过发射激光，激光雷达可以精确测量光在某个方向上的传播距离以及它与障碍物的距离。这个信息很有用，但它只是自动驾驶长征中的第一步。根据分析点的距离，我们无法直接读出点云对应的对象以及对象的移动方式，也无法猜测无法反映在三维点云上的汽车牌照、车道标志和交通标志信息。此外，激光雷达会在雨雪或浓雾的情况下进行攻击，这会干扰激光。激光雷达的优点是它可以克服三维测距的难题，从一个相对容易的起点开始进行自动驾驶。我公司不使用激光雷达，主要考虑的是成本。今天，32行激光雷达的市场价格是8万美元。在三年的时间里，激光雷达的成本会成为自动驾驶普及的最大障碍吗？现在没人知道。图森的选择是花更多的时间去做我们擅长的事情（在没有激光雷达的帮助下直接基于机器视觉开发算法），而不是将我们的道路商业化。被我们无法控制的事物所限制。InfoQ：最近特斯拉的身份识别失败是否有可能避免交通事故的发生？或者，误认的可能性有多大？以特斯拉最近发生的交通事故为例？辅助驾驶/无人驾驶算法有哪些改进？（是否有论文或专利？）侯小迪：首先，MobileEye的Eyeq3本身只是一个辅助驱动系统。但当市场接受特斯拉的概念时，它被吹捧为自动驾驶。这相当于特斯拉早期在自动驾驶技术方面的公众信任。这是一件可怕的事情。其次，小概率并不意味着它永远不会发生，所以即使经过一百年，我相信汽车驾驶事故也不会完全避免。所以我将在这里讨论当前的系统。当前模式识别学术界（以及从学术界衍生出来的行业）过度地将准确性作为单一的优化目标。一方面，我们都知道，算法的精度越高，就越难爬得更远；另一方面，很少有人关注识别错误时该如何做的问题。通常的做法是在错误的时间扣一分，不管你是没看到前面有一辆大卡车，还是记下

« 京东王晓松首先谈到新鲜电子商务：新鲜比手机更苦！ | 孙杨国王重返爱倩乐队，红菱风投和鲁金的实力主张粉碎了谣言。 »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-8

百度统计