< >
Home » Turbot-DL入门教程 » Turbot-DL入门教程篇-TensorFlow应用-读取CSV文件实例

Turbot-DL入门教程篇-TensorFlow应用-读取CSV文件实例

说明:

  • 介绍如何使用tensorflow读取CSV文件

环境:

  • Python 3.5.2

步骤:

  • 以鸢尾花数据集(iris)为例,数据集包含3种鸢尾花(山鸢尾、变色鸢尾、维吉尼亚鸢尾,分别用0、1、2表示)

  • 在每个样品中测量4个特征:花萼长度(seqpallength)、花萼宽度(sepalwidth)、花瓣长度(petallength)、花瓣宽度

  • 鸢尾花的数据集下载链接如下:

    鸢尾花训练集:http://download.tensorflow.org/data/iris_training.csv
    鸢尾花测试集:http://download.tensorflow.org/data/iris_test.csv

  • 下载iris_training.csv文件,放到Python可执行文件的相同目录中

  • 新建文件

$ vim tensorflow_csv.py
  • 内容如下
import tensorflow as tf
filename_queue = tf.train.string_input_producer(tf.train.match_filenames_once("iris_training.csv"),shuffle = True)
reader = tf.TextLineReader(skip_header_lines=1)
key, value = reader.read(filename_queue)
record_defaults = [[0.],[0.],[0.],[0.],[1]]
col1, col2, col3, col4, col5 = tf.decode_csv(value, record_defaults = record_defaults)
features = tf.stack([col1,col2,col3,col4]) 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    sess.run(tf.local_variables_initializer())

    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(coord = coord)

    for i in range(5):
        examples = sess.run([features])
        print(examples) 
    coord.request_stop()
    coord.join(threads)
  • 执行
pythton3 tensorflow_csv.py
  • 结果如下
[array([6.4, 2.8, 5.6, 2.2], dtype=float32)]
[array([5  , 2.3, 3.3, 1. ], dtype=float32)]
[array([4.9, 2.5, 4.5, 1.7], dtype=float32)]
[array([4.9, 3.1, 1.5, 0.1], dtype=float32)]
[array([5.7, 3.8, 1.7, 0.3], dtype=float32)]

纠错,疑问,交流: 请进入讨论区点击加入Q群

获取最新文章: 扫一扫右上角的二维码加入“创客智造”公众号


标签: turbot-dl入门教程篇