TensorFlow练习22: 手写汉字识别
MNIST手写数字数据集通常做为深度学习的练习数据集,这个数据集恐怕早已经被大家玩坏了。本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Convolutional Network识别手写汉字。识别手写汉字要把识别手写洋文难上很多。首先,英文字符的分类少,总共10+26*2;而中文总共50,000多汉字,常用的就有3000多。其次,汉字有书法,每个人书写风格多样。手写汉字数据集: CASIA-HWDB下载HWDB1.1数据集:$ wget http://w...
TensorFlow练习21: 把Deep Dream应用到视频上
前帖<实现谷歌Deep Dream>可以生成扭曲的图像,本帖就基于前一贴的代码在视频上应用Deep Dream,应该能生成比较抽的视频。代码逻辑:使用ffmpeg从视频中提取帧为每一帧图像应用Deep Dream使用ffmpeg把帧图像重新组合成视频,最后和音频合并
TensorFlow练习19: 预测天朝铁路客运量
以前做的练习还没有涉及过时间序列数据(洋文Time Series Data),一个最明显的例子是股票价格。时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。一年一度的春节又要来了,火车票已经开售。本帖就简单预测一下未来几个月天朝铁路客运量。铁路客运量历史数据铁路客运量.csv(2005-2016月度数据),数据来源于国家捅计菊。使用matplotlib画出数据走势:
TensorFlow练习18: 根据姓名判断性别
本帖训练一个可以根据姓名判断性别的CNN模型;我使用自己爬取的35万中文姓名进行训练。使用同样的数据集还可以训练起名字模型,参看:TensorFlow练习7: 基于RNN生成古诗词https://github.com/tensorflow/models/tree/master/namignizerTensorFlow练习13: 制作一个简单的聊天机器人准备姓名数据集我上网找了一下,并没有找到现成的中文姓名数据集,额,看来只能自己动手了。我写了一个简单的Python脚本,爬取了上万中文姓名,格式整理如下:
TensorFlow练习17: “声音大挪移”
看见本帖标题,你可能会问:“声音大挪移”是什么鬼玩意,和张无忌有什么关系。如果你没看过鬼畜,先温习两个:【元首】粉红的回忆、【圣地亚哥金曲】客官不可以。(本帖内容和鬼畜关系不大)前文《实现谷歌Deep Dream》可生成带有艺术感的图片。其实,还有另一种合成图片的方式,洋文叫Style Transfer,这种方法需要用到两张图片,如下图: + =
TensorFlow练习16: 根据大脸判断性别和年龄
本帖使用TensorFlow做一个根据脸部推断照片人物年龄和性别的练习,网上有很多类似app。训练数据 – Adience数据集Adience数据集来源为Flickr相册,由用户使用iPhone或者其它智能手机设备拍摄,该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时,里面还进行了相应的landmark的标注,其中包含2284个类别和26580张图片。Adience数据集下载地址:http://www.openu.ac.il/home/hassner/Adience/data.html#agegend...
TensorFlow练习15: 中文语音识别
语音识别的应用领域非常广泛,洋文名Speech Recognition。它所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。语音识别是前文《聊天机器人》必不可少的一个组件,本帖就使用TensorFlow做一个中文语音识别。使用的数据集THCHS30是Dong Wang, Xuewei Zhang, Zhiyong Zhang这几位大神发布的开放语音数据集,可用于开发中文语音识别系统。为了感谢这几位大神,我是跪在电脑前写的本帖代码。下载中文语音数据集(5G+):
TensorFlow练习14: 使用深度学习给黑白图像上色
网上有很多使用PS给黑白老照片上色的教程,下图是P上颜色的爱因斯坦: 于是,有大牛使用深度学习制作了一个自动给黑白图像上色的模型,非常非常的牛叉。colornetAutomatic ColorizationHypercolumns for Object Segmentation and Fine-grained LocalizationThe major advancements in Deep Learning in 2016本帖就使用前文的妹子图训练这个模型,看看效果。
TensorFlow练习13: 制作一个简单的聊天机器人
现在很多卖货公司都使用聊天机器人充当客服人员,许多科技巨头也纷纷推出各自的聊天助手,如苹果Siri、Google Now、Amazon Alexa、微软小冰等等。前不久有一个视频比较了Google Now和Siri哪个更智能,貌似Google Now更智能。本帖使用TensorFlow制作一个简单的聊天机器人。这个聊天机器人使用中文对话数据集进行训练(使用什么数据集训练决定了对话类型)。使用的模型为RNN(seq2seq),和前文的《RNN生成古诗词》《RNN生成音乐》类似。相关博文:
TensorFlow练习12: 判断男声女声
本帖训练一个简单的神经网络模型,用来判断声音是男是女。本帖数据集取自voice-gender项目,这个项目使用了n种分类模型,并比较了准确率,但是它没有使用神经网络模型,本帖算是一个补充。数据集这个数据集是经过R语言处理过的,它提取出了.WAV文件的一些声音属性。如果你想自己从wav文件中提取声音属性,参看voice-gender项目中一个叫sound.R源码文件。数据集字段:”meanfreq”,”sd”,”median”,”Q25″,”Q75″,”IQR”,”skew”,”kurt”,”sp.ent”,”...