将非ASCII字符打印到CSV文件中

3

我正在尝试使用PHP创建CSV文件。如何打印非ASCII字符?

8个回答

10

可以在CSV文件中使用Unicode字符,只需确保使用正确的HTTP头即可。在OpenOffice中效果很好,但如果我没记错,Excel在显示带有Unicode字符的CSV文件时会出现一些问题。

此外,您应该尝试使用fputcsv函数,它能够简化操作。当您需要实时创建文件时,可以使用PHP输出流

因此,类似下面的代码就能够实现:

$handle = fopen("php://output", "w");

header("Content-Type: text/csv; charset=UTF-8");
fputcsv($handle, $fields, ';', '"');

fclose($handle);

编辑
阅读了您的评论后,似乎您在转换如é这样的html实体时遇到了问题。要转换这些实体,您必须确保每个字段都被解码。您可以使用html_entity_decode来完成此操作:

$decoded_string = html_entity_decode($string, ENT_QUOTES, 'UTF-8');

顺便说一句,大多数情况下将文本存储为htmlentities格式不是个好主意,因为当你不想输出html(比如在这种情况下)时,你需要将其转换回真实字符。更容易的方法是将文本存储为Unicode格式。


4

fputcsv 应该能够处理 utf-8 编码。


您好!CSV文件是通过动态生成而非文件指针生成的。文件头是通过header() PHP指令发送的,每个记录都是通过echo()动态添加的。 祝好! - Rui Gonçalves
2
Rui:你仍然可以使用fputcsv('php://output')动态生成文件。实际上,这比通过连接字符串在PHP中创建CSV文件更好。 - Marc Gear

1
这是我使用的东西,我相信它可能需要一些优化以适应您的情况,但总体来说非常通用且对许多情况非常有用。
您只需提供函数所需的 SQL,它就会输出一个 CSV 文件,并包含列名称的标题行。
<?php
function exportMysqlToCsv($csvsql,$filename = 'export.csv')
{
    $csv_terminated = "\n";
    $csv_separator = ",";
    $csv_enclosed = '"';
    $csv_escaped = "\\";
    $sql_query = $csvsql;

    // Gets the data from the database
    $result = mysql_query($sql_query);
    $fields_cnt = mysql_num_fields($result);


    $schema_insert = '';

    for ($i = 0; $i < $fields_cnt; $i++)
    {
        $l = $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed,
            stripslashes(mysql_field_name($result, $i))) . $csv_enclosed;
        $schema_insert .= $l;
        $schema_insert .= $csv_separator;
    } // end for

    $out = trim(substr($schema_insert, 0, -1));
    $out .= $csv_terminated;

    // Format the data
    while ($row = mysql_fetch_array($result))
    {
        $schema_insert = '';
        for ($j = 0; $j < $fields_cnt; $j++)
        {
            if ($row[$j] == '0' || $row[$j] != '')
            {

                if ($csv_enclosed == '')
                {
                    $schema_insert .= $row[$j];
                } else
                {
                    $meta = mysql_fetch_field($result, $j);
                    if($meta->type == "int" || $meta->type == "real")
                    {
                      $schema_insert .= $row[$j];
                    } else {
                      $schema_insert .= $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed, $row[$j]) . $csv_enclosed;
                    }
                }
            } else
            {
                $schema_insert .= '';
            }

            if ($j < $fields_cnt - 1)
            {
                $schema_insert .= $csv_separator;
            }
        } // end for

        $out .= $schema_insert;
        $out .= $csv_terminated;
    } // end while

    header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
    header("Content-Length: " . strlen($out));
    // Output to browser with appropriate mime type, you choose ;)
    header("Content-type: text/x-csv");
    //header("Content-type: text/csv");
    //header("Content-type: application/csv");
    header("Content-Disposition: attachment; filename=$filename");
    echo $out;
    exit;

} 
?>

0

正如您所说,它们是即时生成的(即您使用echo等直接输出它们),那么以下内容将有所帮助:

1)在您的PHP代码开头添加此标头:

 header ('Content-type: text/csv; charset=utf-8');

2)在HTML代码中添加此元标签:

 <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

3) 将你的 PHP 代码文件保存为 UTF-8 without BOM


你好! 还是不行。所有的非ASCII字符都被显示为HTML实体(例如é被显示为é)。 最好的问候。 - Rui Gonçalves
如果你要输出 CSV,那么使用 "header('Content-type: text/csv; charset=utf-8')" 肯定是你想要的。 - Dai

0

实际上,shamittomar的答案非常好,但它缺少一件事情

你的问题与编码有关
你应该将文本编码转换为UTF-8 因为php在内部使用ascii

例如:

$str = mb_convert_encoding($str , "UTF-8") ; 

请参考 php.net 获取更多信息


0

The best example which I found is this one.

    function str_to_csv($row) {
        if ($row == '') {
            return array();
        }
        $a = array();
        $src = explode(',', $row);
        do {
            $p = array_shift($src);
            while (mb_substr_count($p, '"') % 2 != 0) {
                if (count($src) == 0) {
                    return false;
                }
                $p .= ',' . array_shift($src);
            }
            $match = null;
            if (preg_match('/^"(.+)"[\r\n]*$/', $p, $match)) {
                $p = $match[1];
            }
            $a[] = str_replace('""', '"', $p);
        } while (count($src) > 0);
        return $a;
    }

    function file_getcsv($f) {
        $line = fgets($f);
        while (($a = str_to_csv($line)) === false) {
            if (feof($f)) {
                return false;
            }
            $line .= "\n" . fgets($f);
        }
        return $a;
    }

    function file_to_csv($filename) {
        ini_set("auto_detect_line_endings", true);
        $a = array();
        $f = fopen($filename, 'r');
        while (!feof($f)) {
            $rec = file_getcsv($f);
            if ($rec === false) {
                return false;
            }
            if (!empty($rec)) {
                $a[] = $rec;
            }
        }
        fclose($f);
        return $a;
    }

    $data = file_to_csv('base2.csv');

    echo '<pre>';
    print_r($data);


0

当您选择网页的页面信息时,请检查文件编码。它应该是UTF-8。如果不是,则输出的数据是非UTF。
此外,请检查您的浏览器设置的字符编码。在Firefox中,它在菜单->视图->字符编码中。


Firefox的字符编码设置为UTF-8。PHP源文件也是UTF-8。 - Rui Gonçalves
在您的 PHP 脚本中回显 CSV 字符串之前,可以执行 mb_check_encoding (http://www.php.net/manual/en/function.mb-check-encoding.php)。尝试执行 mb_check_encoding($csvString, 'UTF-8'); - Jithin
如果您发现字符串的编码不是UTF-8,您可以尝试使用mb_convert_encoding(http://www.php.net/manual/en/function.mb-convert-encoding.php)进行转换。 - Jithin

0
简单地使用utf8_encode()函数,在您想要打印或获取非ASCII字符的地方。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接