【群聊问题】如何读取PPT文件里的内容并统计字数?

和PHPExcel一样,Github上也可以下载到PHPPresentation这插件,用来读取PPT里面的内容,但是:


PPT的组成要比Excel复杂多了,在读取内容的时候有不少注意事项,介绍起来大概需要一两个小时。


我给你一些初始代码,你可以自己研究着看看。


参见附件:


http://translation.education/coding/plugins/wc_editor/static/ueditor/dialogs/attachment/fileTypeImages/icon_rar.gif
ppt.zip


解压缩到htdocs里面,直接运行ppt/index.php就可以看到读取到的示例PPT的全部内容


Github上对应的库是:https://github.com/PHPOffice/PHPPresentation


其实读取PPT的代码很简单,但从幻灯片里读取内容就要复杂一点儿。


/coding/uploads/files_user1/question/5f2b5ac46126d215242.png


群聊科普:


在本书中我介绍怎了读取Excel表格中的内容,并统计指定内容的字数。Ruxin问到怎么统计PPT的内容字数,所以我给她提供了一段示例代码,供她参考,这个如果写出来的话又能写一大章。


无论是Excel还是PPT,读取文件的原理都非常简单,找到一个库,安装好,然后了解一下库的主要函数,然后就可以开始读取了。


我们一般都是把所有数据先读取到数组中,然后用[]方括号来根据自己的需求读取自己想要的数据,把读取出来的东西放到新的变量中去处理,包括机器翻译、统计字数什么的。


已邀请:

要回复问题请先登录注册