我刚刚了解到MySQL有一个本地的CSV存储引擎,它会将每个表的数据存储在逗号分隔值文件中。
是否可以直接从上传的CSV文件中创建表格,类似于以下内容:
CREATE TABLE USERS < PATH/USERS.CSV
用户上传的 users.csv
文件存储在哪里?
我刚刚了解到MySQL有一个本地的CSV存储引擎,它会将每个表的数据存储在逗号分隔值文件中。
是否可以直接从上传的CSV文件中创建表格,类似于以下内容:
CREATE TABLE USERS < PATH/USERS.CSV
用户上传的 users.csv
文件存储在哪里?
我刚刚发现了csvkit,它是一组用于CSV文件的Unix命令行工具。我使用pip install csvkit
在我的Mac上安装了它。命令是:
csvsql --dialect mysql --snifflimit 100000 bigdatafile.csv > maketable.sql
你也可以提供一个数据库连接字符串,它可以直接加载表。
sudo apt-get install python3-csvkit
安装它。 - Marc Johnencsvsql --db mysql://user:password@localhost:3306/dbschema --tables mytable --insert file.csv
(您还需要安装python3-pymysql)。 - Marc Johnen由John Swapceinski于2011年9月5日上午5:33发布。
使用.csv文件的标题创建表:
#!/bin/sh
# pass in the file name as an argument: ./mktable filename.csv
echo "create table $1 ( "
head -1 $1 | sed -e 's/,/ varchar(255),\n/g'
echo " varchar(255) );"
VARCHAR(255)
?如果是这样的话,那么它并不是真正有用的。 - Heisenberg我建议使用MySQL Workbench来导入数据。Workbench允许用户从CSV或JSON格式的文件中创建新表。通过向导,它可以在几个点击内处理表模式和数据导入。
在MySQL Workbench中,在表列表上使用上下文菜单,点击Table Data Import Wizard
。
有关更多MySQL Workbench6.5.1表数据导出和导入向导可在此查询。下载MySQL Workbench。
如果你使用phpMyAdmin作为MySQL前端,有一种更简单的办法:
如果你遇到问题,不用担心,只需删除数据库并重试即可。
如果有人正在寻找PHP解决方案,请查看 "PHP_MySQL_wrapper":
$db = new MySQL_wrapper(MySQL_HOST, MySQL_USER, MySQL_PASS, MySQL_DB);
$db->connect();
// this sample gets column names from first row of file
//$db->createTableFromCSV('test_files/countrylist.csv', 'csv_to_table_test');
// this sample generates column names
$db->createTableFromCSV('test_files/countrylist1.csv', 'csv_to_table_test_no_column_names', ',', '"', '\\', 0, array(), 'generate', '\r\n');
/** Create table from CSV file and imports CSV data to Table with possibility to update rows while import.
* @param string $file - CSV File path
* @param string $table - Table name
* @param string $delimiter - COLUMNS TERMINATED BY (Default: ',')
* @param string $enclosure - OPTIONALLY ENCLOSED BY (Default: '"')
* @param string $escape - ESCAPED BY (Default: '\')
* @param integer $ignore - Number of ignored rows (Default: 1)
* @param array $update - If row fields needed to be updated eg date format or increment (SQL format only @FIELD is variable with content of that field in CSV row) $update = array('SOME_DATE' => 'STR_TO_DATE(@SOME_DATE, "%d/%m/%Y")', 'SOME_INCREMENT' => '@SOME_INCREMENT + 1')
* @param string $getColumnsFrom - Get Columns Names from (file or generate) - this is important if there is update while inserting (Default: file)
* @param string $newLine - New line delimiter (Default: \n)
* @return number of inserted rows or false
*/
// function createTableFromCSV($file, $table, $delimiter = ',', $enclosure = '"', $escape = '\\', $ignore = 1, $update = array(), $getColumnsFrom = 'file', $newLine = '\r\n')
$db->close();
#!/bin/bash
CREDENTIALS="--user=root --password=password --host=localhost --port=3306"
CSVOPTIONS="$CREDENTIALS --local --delete --lock-tables --fields-terminated-by=; --fields-optionally-enclosed-by=\" --lines-terminated-by=\n"
FOLDER='my/folder'
files=(
foo.csv
bar.csv
)
for i in "${files[@]}"
do
# get table name from file name
TABLE="$(basename -- $i)"
TABLE="${TABLE%.*}"
# create the table
COMMAND="DROP TABLE IF EXISTS $TABLE; CREATE TABLE $TABLE ( $(head -1 $FOLDER/$i | sed -e 's/;/ varchar(255),\n/g') varchar(255) );"
mysql $CREDENTIALS $DB -e "$COMMAND"
# fill in data
mysqlimport $CSVOPTIONS --ignore-lines=1 $DB "$FOLDER/$i"
done
我采用了shiplu.mokadd.im的脚本来满足我的需求。对于它感兴趣的人:
#!/bin/bash
if [ "$#" -lt 2 ]; then
if [ "$#" -lt 1 ]; then
echo "usage: $0 [path to csv file] <table name> > [sql filename]"
exit 1
fi
TABLENAME=$1
else
TABLENAME=$2
fi
echo "CREATE TABLE $TABLENAME ( "
FIRSTLINE=$(head -1 $1)
# convert lowercase characters to uppercase
FIRSTLINE=$(echo $FIRSTLINE | tr '[:lower:]' '[:upper:]')
# remove spaces
FIRSTLINE=$(echo $FIRSTLINE | sed -e 's/ /_/g')
# add tab char to the beginning of line
FIRSTLINE=$(echo "\t$FIRSTLINE")
# add tabs and newline characters
FIRSTLINE=$(echo $FIRSTLINE | sed -e 's/,/,\\n\\t/g')
# add VARCHAR
FIRSTLINE=$(echo $FIRSTLINE | sed -e 's/,/ VARCHAR(255),/g')
# print out result
echo -e $FIRSTLINE" VARCHAR(255));"