当前位置 首页 学霸的AI系统 第16章 她白得就跟250一样

《学霸的AI系统》第16章 她白得就跟250一样

作者:马了个甲 字数:2111 书籍:学霸的AI系统

  齐凡又喝下一口贤者饮料,给自己充能。

  对图像的数字化处理,首先自然就是将彩色图转化为灰度图。简单来说,就是将一张彩色照片弄成黑白的。

  之后那黑白图像上的一个个像素点的灰度值,便是计算机看到的东西。

  齐凡忽的想起李月。她可真白!

  贤者状态下的齐凡是很纯洁的,比4个9的黄金还要纯。他想起李月完全是因为好奇该如何用数字形容她的白。

  灰度值的范围是0~255。0代表纯黑,255代表纯白。

  李月该有多白。150?200?还是250?

  齐凡觉得一定是250。她白得就跟250一样。

  人类通过一个个像素点的灰度值就能识别出物体,其实计算机也是这么干的。

  这其实是很浅显易懂的道理。只要这个世界上没有修仙和魔法,那做同一件事情多半就是用同一种方法,只不过是过程有些不同罢了。

  就如,人类对着一副图像看一样就什么都明白了,人类自己甚至都感受不到这个过程。

  你看到图像上有一只猫,你不会下意识去思考“我为什么会认为它就是一只猫”。也就是说,人类根本不明白自己识别的过程。

  因而在于如何教计算机识别图像的问题上,人类绞尽脑汁,这类问题就是机器学习诞生的初衷。

  齐凡通过阅读许阳他们的代码,知道他们并未采用简单的线性回归来处理数字识别。他想想也是,毕竟线性这东西就如一个直男,脑子永远就是一根筋的,只能走直线,走不了曲线,自然也就处理不了复杂些的问题。

  比如:异或问题。这是一个最典型的非线性问题。

  所谓异或,就是:同为0,异为1。两个数字1异或之后结果是0。

  用白话来解释线性和异或的话,线性可以看成是按套路办事,非线性则可看成不按套路出牌。异或就是不按套路出牌的一种典型情况。

  如果计算模型是线性的,那无论如何它也无法处理非线性的问题。哪怕是把现有CPU的运算能力翻一万倍,那也是无济于事的。

  这就好比一个男人还没结婚的时候,他的钱都是他的。结婚之后,计算机按往常理解,就是把夫妻双方的钱加起来除以2。

  不加干预的话,计算机是无法自己开窍其实不是除以2,而是很可能向某一方汇聚,最后男方那边剩余是0。

  面对这种问题,线性方法是处理不了问题的。这个时候可以用SVM支持向量机的升维。

  就好比婚后的一对男女同住在一块,男的保不住钱。那怎么办?可以人为制造一个维度将男女分开,一个在天南一个在地北。这样两人的地域就不在一个维度了。通过新增一个地域维度,从而实现地域维度上的分离,这样男人的钱就能保住了。

  当然,计算机的世界里没有微信转账,这种可以沟通不同地域维度的东西。

  齐凡也不知道自己看书看着看着,怎么脑子里会有这么多奇奇怪怪的想法。他自己也知道这个例子用来形容SVM不是很恰当,但他觉得这个例子很有意思。

  他觉得直男是想不出这种例子的。

  贤者饮料的牛X莫过于此--让不是直男的齐凡,在进入贤者状态后,思维无限自由发散,却能在面对欲望的时候,表现得比直男直一万倍。

  齐凡自己都没有察觉到这一点。否则的话,他多半会去做一件事--看些小成本电影。

  他肯定会好奇,自己能否在深切感知电影主角们悸动的同时,自身又能做到心如止水。

  齐凡收回思绪,回到数字图像处理的问题上。

  SVM的作用主要是拿来分类,而数字识别就是一个典型的分类问题。因为一个数字只有0~9这几种可能。

  而分类问题体现在数学上,其实就是对坐标系的分割。

  每一张包含了手写数字的图像,通过提取特征后,都可以在坐标系找到属于它的位置。而SVM要干的事情,就是仔细划分这些不同位置的坐标点。

  属于“0”的坐标点要和“1”的坐标点清清楚楚地分开。其余数字依次同理。

  这个坐标系很复杂,有N个维度。假如一张图片的像素点是100*100的,将它整个扔给计算机的话,那就有1万个输入维度。人类所能理解的图形极限是三维,所以1万维是完全不可能画得出来的。

  画不出来还是小事,可以自行脑补嘛。计算和特征提取才是大事。

  维度越大,所需的计算量也就越大,算得也就越慢。如果一个程序识别一个手写数字要花10秒,那一定会被骂成“人工智障”,这就是“人工智障三人组”最初名号的由来。齐凡是从计算机学院其他学长口中得知的。当然,现在已经不这样了。

  所以,进行计算前,势必要将图像参数简化一下。

  同时,图像还涉及到清晰度和对比度的问题。

  因而,齐凡被图像的“池化”“锐化”等概念虐了一通后,总算将它们掌握了。

  最后就到了最关键的一步--图像最真实的特征。

  图像的特征自然是来自于像素点。可其实不仅仅体现在像素点的灰度值上,还体现在像素点的排列上。

  如果直接将像素点的坐标和值作为输入参数,那就会带来一个问题。

  假如一个一模一样的数字“1”,出现在一张纸的不同位置。这对以上方法来说,就是不同的输入参数,因为其坐标位置变化了。可按实际情况,这个数字并没有任何改变,只是位置发生了变化而已。

  位置的变化不应该带来输入参数的变化,因为人类识别数字也并不需要参数数字整体的位置。

  齐凡带着疑问在书上找到了答案--变化特征。

  通过提取相邻像素点灰度值的变化作为特征,这样就能摒弃数字坐标位置不同而引入的干扰。

  这就是方向梯度直方图(Histogram of Oriented Gradient)的核心概念。

  【计算机经验+10。】

  到此为此,图像特征提取部分已被齐凡搞定。

  剩下的,就是找寻许阳他们所用的模型到底是哪里出了问题,以至于会出现40%多识别错误率。

  -----------------

  心情愉悦的齐凡,收起东西从图书馆回到宿舍。

  齐凡一进宿舍,王哲就火急火燎地开口,“怎么发你微信过了半天才回,今天微积分课吴院长点名,你又不是在。他现在每回都会特意关注你,你要是再不去,他可真就要发飙了。”

  齐凡最近的行为在同学们看来简直就是作死,连最近看不惯他的贾震都开始对他同情了。

  “齐凡,十年寒窗不容易,伱这么个作法,早晚要被开除学籍的。何必呢。”只要不挑战贾震的学霸权威,他也不是什么十足的坏人。

  “多谢你们关心。可我早就和你们说过了呀。是因为王教授叫我去帮忙。”

  从对面两人的神情来看,显然不信。齐凡也只有无奈。

  “算了,等后天吧。后天的微积分课正好有些内容我还需要巩固下,到时你们看,吴院长会不会管我。”齐凡自信王教授肯定已经都打好招呼了。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 回到书页 下一章 > 错误反馈

设为首页加入收藏保存桌面网址发布会员中心留言本

Copyright © 2024-2025 All Rights Reserved