Ruby和MySQL UTF-8字符

3
我正在将一个Sinatra应用程序从SQLite3切换到MySQL。出于某种我无法理解的原因,当我使用Ruby和Sequel从MySQL中提取数据时,字符显示为8位ASCII而不是UTF-8。
部署环境是FreeBSD 9.1和MySQL 5.6.12,使用从FreeBSD ports安装的系统范围内ruby19。RVM ruby-2.0p247也产生相同的结果。
我的my.cnf如下:
# The following options will be passed to all MySQL clients
[client]
default-character-set=utf8
#password = your_password
port    = 3306
socket    = /tmp/mysql.sock
# Here follows entries for some specific programs

# The MySQL server
[mysqld]
port    = 3306
socket    = /tmp/mysql.sock
skip-external-locking
key_buffer_size = 128M 
max_allowed_packet = 1M
table_open_cache = 256
sort_buffer_size = 1M
read_buffer_size = 1M
read_rnd_buffer_size = 2M
myisam_sort_buffer_size = 32M
thread_cache_size = 4
query_cache_size= 8M 
# Try number of CPU's*2 for thread_concurrency
thread_concurrency = 2

# encoding issues
character-set-server=utf8
collation-server=utf8_general_ci

log-bin=mysql-bin
binlog_format=mixed
server-id = 1
[mysqldump]
quick
max_allowed_packet = 16M

[mysql]
no-auto-rehash
safe-updates

[myisamchk]
key_buffer_size = 64M
sort_buffer_size = 64M
read_buffer = 1M
write_buffer = 1M

[mysqlhotcopy]
interactive-timeout

我所有的文件都使用shebang行以及UTF-8编码,就像我用来测试条目的这个脚本一样:

#!/usr/bin/env ruby
# encoding: UTF-8

require 'sequel'

msql = Sequel.connect(adapter: 'mysql', host: 'localhost', database: 'metrosignage', user: 'atma', password: 'toola697', encoding: 'utf8')

b = msql[:drama_addressbook]
b.each do |entry|
  p entry
  # p entry[:city].force_encoding("utf-8")
end

如果我使用entry[:city].force_encoding("utf-8"),输出就是正确的,希腊语的UTF-8字符可以正常显示。但是我不明白为什么不能直接提取UTF-8。
我正在读取数据的表是使用以下SQL创建的:
CREATE TABLE `drama_addressbook` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `address` varchar(255) DEFAULT NULL,
  `address_no` int(11) DEFAULT NULL,
  `address_description` varchar(255) DEFAULT NULL,
  `phone` varchar(255) DEFAULT NULL,
  `city` varchar(255) DEFAULT NULL,
  `country` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=30 DEFAULT CHARSET=utf8;

因此,数据库是UTF-8的,数据也是UTF-8的。我的问题是:

  • 我做错了什么吗?
  • 为什么Ruby需要使用 force_encoding

你是这样创建数据库的吗?CREATE DATABASE metrosignage DEFAULT CHARSET utf8; - Patrick Oscity
可能是重复的问题:sequel 永远不会返回 utf-8,只会返回 ascii-8bit - Patrick Oscity
1个回答

4
尝试使用mysql2适配器代替mysql适配器,因为我相信mysql2驱动程序处理编码,而mysql驱动程序不会。

2
谢谢,那个很好用!我简直不敢相信默认适配器不支持UTF-8,但无论如何 :-) 非常感谢! - patm
1
我正在使用mysql2本身,但是我遇到了问题。以下是我使用的代码:Sequel.mysql2('some_db', :user => 'user', :password => 'password', :host => 'localhost', :encoding => 'utf8', :loggers => [logger]) - Jikku Jose

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接