公司 · 新闻
网站建设 读取dock文字
2021-09-02来源:越跃科技

unoconv —— Linux中将DOCX文件转化为Text

unoconv 转换 doc,docx,xls,xlsx,ppt,pptx 文件

安装unoconv

yum install unoconv

doc转换成pdf

/usr/bin/unoconv -f pdf /home/1.doc

doc转换成txt

/usr/bin/unoconv -f txt /home/1.doc

docx转换成txt

/usr/bin/unoconv -f txt /home/1.docx

php中使用需要另外安装unoconv

解压并安装

unzip unoconv-master.zipcd unoconv-master/make install

执行完以上操作后接下来可以执行转换命令了,例如

/usr/bin/unoconv -f txt	/www/1.docx

得到 /www/1.txt

如果中文乱码可以用以下方式解决
将Windows下的Fonts,如:C:\Windows\Fonts,压缩成Fonts.zip压缩包。
将压缩包拷贝到Linux目录下,执行以下命令便可:

unzip Fonts.zipmkdir /usr/share/fonts/wincp Fonts/* /usr/share/fonts/wincd /usr/share/fonts/winchmod  -Rf 755 *
mkfontscale  
mkfontdir  
fc-cache –fv

重启服务器便可。

php中使用

shell_exec('/usr/bin/unoconv -f txt /www/1.docx - 2>&1');

得到 /www/1.txt

    $filename='/www/1.txt';
    $handle = fopen($filename, "r");//读取文件
    //通过filesize获得文件大小,将整个文件一下子读到一个字符串中
    $contents = fread($handle, filesize ($filename));//获取到了内容
    fclose($handle);//关闭文件
    unlink($filename);//删除/www/1.txt


联系我们免费获取专属《策划方案》及报价!
  • 网站建设
  • 微信公众号开发
  • 功能网站开发
  • 3D视觉动画
  • 平面设计
  • 营销推广
  • 单位名称

  • 电话*

  • 需求

多一份参考 总有益处
从需求的提炼,到竞品的分析再到方案的策划
为您定制出一套企业本身的专属品牌策划方案
400-9696-213
134-888-19185
北京网站建设-企业网站制作-高端网站设计,专业网站开发服务商
警告弹窗