加载中…
个人资料
Mars-Zhan
Mars-Zhan
  • 博客等级:
  • 博客积分:0
  • 博客访问:319,296
  • 关注人气:52
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Kettle数据抽取(转换)mysql出现乱码问题解决方法

(2017-12-05 09:53:16)
标签:

kettle

在kettle中进行数据抽取,如果抽取的源数据库和目标数据库不是同一个数据库,可能会导致转换后的中文出现乱码情况,原因是由于在中文环境下有的数据库客户端默认编码格式是UTF-8,而另外的数据库编码格式是GBK,这样就导致数据乱码的情况出现。

针对这个问题,只需要在Database connection中做一个配置即可,具体步骤如下:

1.点击如下图Transform或jobs的DB连接。
http://blog.itpub.net/attachment/201311/27/10009036_1385539555jjVk.jpg


2.在弹出的Database Connection中选择Options选项,在Parameters下填入参数“characterEncoding”,其value为“gbk”,如下图。

http://blog.itpub.net/attachment/201311/27/10009036_1385539577MrnB.jpg

这样,就能解决kettle抽取数据过程中的中文乱码问题。

附:

针对mysql数据库,如果在pentaho平台上执行kettle的数据抽取,并且在作出上述修改后仍然出现乱码的话,可以考虑以下几个方面:

1.    pentaho的META-INF/context.xml中数据源的url后面添加“useUnicode=true&characterEncoding=utf8&characterSetResults=utf8”完整的配置如下

或在pentaho的Database Connection的options中配置以上参数

[c-sharp] view plaincopyprint?

1. 

2.  factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxIdle="5"

3.  maxWait="10000" username="root" password="root"

4.  driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/bi?useUnicode=true&characterEncoding=utf8&characterSetResults=utf8"

5.  validationQuery="select 1" />

2.检查mysql数据库server端字符集是否是utf-8,如果不是的话,修改为utf-8。
转载:http://blog.itpub.net/10009036/viewspace-1061281/

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有