python输出powerpoint(ppt)文件中全部文字信息的方法

本文实例讲述了python输出powerpoint(ppt)文件中全部文字信息的方法。分享给大家供大家参考。具体分析如下:

下面的代码依赖于windows com,所以必须在机器上安装powerpoint才能用,可以将ppt文件中的所有纯文本信息进行输出到指定的文件,非常实用。

import win32com
from win32com.client import dispatch, constants
ppt = win32com.client.dispatch(‘powerpoint.application’)
ppt.visible = 1
pptsel = ppt.presentations.open(“c:\\1.ppt”)
win32com.client.gencache.ensuredispatch(‘powerpoint.application’)
f = file(“c:\\1.txt”,”w”)
slide_count = pptsel.slides.count
for i in range(1,slide_count + 1):
shape_count = pptsel.slides(i).shapes.count
print shape_count
for j in range(1,shape_count + 1):
if pptsel.slides(i).shapes(j).hastextframe:
s = pptsel.slides(i).shapes(j).textframe.textrange.text
f.write(s.encode(‘utf-8’) + “\n”)
f.close()
ppt.quit()

希望本文所述对大家的python程序设计有所帮助。