我正在尝试使用PHP创建CSV文件。如何打印非ASCII字符?
可以在CSV文件中使用Unicode字符,只需确保使用正确的HTTP头即可。在OpenOffice中效果很好,但如果我没记错,Excel在显示带有Unicode字符的CSV文件时会出现一些问题。
此外,您应该尝试使用fputcsv函数,它能够简化操作。当您需要实时创建文件时,可以使用PHP输出流。
因此,类似下面的代码就能够实现:
$handle = fopen("php://output", "w");
header("Content-Type: text/csv; charset=UTF-8");
fputcsv($handle, $fields, ';', '"');
fclose($handle);
编辑
阅读了您的评论后,似乎您在转换如é
这样的html实体时遇到了问题。要转换这些实体,您必须确保每个字段都被解码。您可以使用html_entity_decode来完成此操作:
$decoded_string = html_entity_decode($string, ENT_QUOTES, 'UTF-8');
顺便说一句,大多数情况下将文本存储为htmlentities格式不是个好主意,因为当你不想输出html(比如在这种情况下)时,你需要将其转换回真实字符。更容易的方法是将文本存储为Unicode格式。
fputcsv 应该能够处理 utf-8 编码。
<?php
function exportMysqlToCsv($csvsql,$filename = 'export.csv')
{
$csv_terminated = "\n";
$csv_separator = ",";
$csv_enclosed = '"';
$csv_escaped = "\\";
$sql_query = $csvsql;
// Gets the data from the database
$result = mysql_query($sql_query);
$fields_cnt = mysql_num_fields($result);
$schema_insert = '';
for ($i = 0; $i < $fields_cnt; $i++)
{
$l = $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed,
stripslashes(mysql_field_name($result, $i))) . $csv_enclosed;
$schema_insert .= $l;
$schema_insert .= $csv_separator;
} // end for
$out = trim(substr($schema_insert, 0, -1));
$out .= $csv_terminated;
// Format the data
while ($row = mysql_fetch_array($result))
{
$schema_insert = '';
for ($j = 0; $j < $fields_cnt; $j++)
{
if ($row[$j] == '0' || $row[$j] != '')
{
if ($csv_enclosed == '')
{
$schema_insert .= $row[$j];
} else
{
$meta = mysql_fetch_field($result, $j);
if($meta->type == "int" || $meta->type == "real")
{
$schema_insert .= $row[$j];
} else {
$schema_insert .= $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed, $row[$j]) . $csv_enclosed;
}
}
} else
{
$schema_insert .= '';
}
if ($j < $fields_cnt - 1)
{
$schema_insert .= $csv_separator;
}
} // end for
$out .= $schema_insert;
$out .= $csv_terminated;
} // end while
header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
header("Content-Length: " . strlen($out));
// Output to browser with appropriate mime type, you choose ;)
header("Content-type: text/x-csv");
//header("Content-type: text/csv");
//header("Content-type: application/csv");
header("Content-Disposition: attachment; filename=$filename");
echo $out;
exit;
}
?>
正如您所说,它们是即时生成的(即您使用echo
等直接输出它们),那么以下内容将有所帮助:
1)在您的PHP代码开头添加此标头:
header ('Content-type: text/csv; charset=utf-8');
2)在HTML代码中添加此元标签:
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
3) 将你的 PHP 代码文件保存为 UTF-8 without BOM。
实际上,shamittomar的答案非常好,但它缺少一件事情
你的问题与编码有关
你应该将文本编码转换为UTF-8
因为php在内部使用ascii
例如:
$str = mb_convert_encoding($str , "UTF-8") ;
请参考 php.net 获取更多信息
The best example which I found is this one.
function str_to_csv($row) {
if ($row == '') {
return array();
}
$a = array();
$src = explode(',', $row);
do {
$p = array_shift($src);
while (mb_substr_count($p, '"') % 2 != 0) {
if (count($src) == 0) {
return false;
}
$p .= ',' . array_shift($src);
}
$match = null;
if (preg_match('/^"(.+)"[\r\n]*$/', $p, $match)) {
$p = $match[1];
}
$a[] = str_replace('""', '"', $p);
} while (count($src) > 0);
return $a;
}
function file_getcsv($f) {
$line = fgets($f);
while (($a = str_to_csv($line)) === false) {
if (feof($f)) {
return false;
}
$line .= "\n" . fgets($f);
}
return $a;
}
function file_to_csv($filename) {
ini_set("auto_detect_line_endings", true);
$a = array();
$f = fopen($filename, 'r');
while (!feof($f)) {
$rec = file_getcsv($f);
if ($rec === false) {
return false;
}
if (!empty($rec)) {
$a[] = $rec;
}
}
fclose($f);
return $a;
}
$data = file_to_csv('base2.csv');
echo '<pre>';
print_r($data);
当您选择网页的页面信息时,请检查文件编码。它应该是UTF-8。如果不是,则输出的数据是非UTF。
此外,请检查您的浏览器设置的字符编码。在Firefox中,它在菜单->视图->字符编码中。
utf8_encode()
函数,在您想要打印或获取非ASCII字符的地方。