Foxit PDF IFilter

1.什么是Foxit PDF IFilter?
Foxit PDF IFilter旨在帮助用户对大量的PDF文档进行索引,从而使用户快速搜索到PDF文档内的文本。Foxit PDF IFilter作为全文本搜索引擎的一个插件,可以过滤文档的格式,抽取文本,并提取出整个文档的属性。

2.IFilter 2.X版本有什么新功能?
与IFilter 1.0相比,IFilter 2.X付费版本能提取更多的属性并且增加了更加丰富的性能:

  • 提取书签功能;
  • 能提取更多文件属性,包括标题、作者、主题、关键字、生成时间/日期,最后保存时间/日期、页数以及文件生成器的应用程序;
  • 可提取附件,包括文档的附件及注释的附件;
  • 新增了日志和用户配置功能,允许用户设置是否过滤某些属性和输出的日志级别;
  • 优化了性能,提高了索引的效率。

3.Foxit FDF IFilter 是免费的吗?
Foxit PDF IFilter免费桌面版本提供给桌面用户免费使用。但是,Foxit PDF IFilter高性能服务器&桌面平台版本,我们为您提供了更快的提取速度和更多的属性提取。此付费版本,您可先试用30天,继续使用则需要购买正式版。我们为开发服务器的备份服务器提供50%的折扣。

4. 免费桌面版本和高性能服务器&桌面版本有什么区别?
对于单核的CPU环境下是没有区别的。在多核CPU的机器上运行,高性能服务器&桌面版本索引的速度会随着CPU的数量增多呈线性的增长。具体功能的差异对比可以查看如下链接:
https://www.foxitsoftware.cn//products/pdf-ifilter/

5.怎样验证Foxit PDF IFilter 的安装是否正确?
第一步 安装后,请确认Foxit PDF IFilter 是否在开始菜单的程序中有显示;
第二步 您可以下载IFilter 检测工具帮助在注册表中验证IFilter安装信息,例如: filtreg.exe;
第三步 安装Windows 桌面搜索工具验证是否可以搜索到PDF文件中的文本。

6.程序升级后,我是否需要重新建立索引?
视具体情况而定。Foxit PDF IFilter由一个核心层和一个安装层组成。如果您更新的是安装层,就不需要重建索引;如果是核心层,则需要在您的电脑中重建索引。

7.IFilter如何在sharepoint foundation 2010上运行?
你可以选择以下两种方法中的任何一种进行操作:
方法一:
1.安装IFilter 。
2.按照以下链接中的具体步骤做进一步配置:
  http://support.microsoft.com/kb/2518465#top
  :请按照以下描述修改步骤中的第4-5条以确保正确注册IFilter;
  4-5. Specify value "{E8978DA6-047F-4E3D-9C78-CDBE46041603}" 修改为 4-5. Specify value "{987F8D1A-26E6-4554-B007-6B20E2680632}"。
方法二:
1.install the search server express 2010 or search server. ;
2.安装IFilter ;
3. 输入如下命令:  ;
iisreset;
net stop spsearch4 ;
net start spsearch4 ;
net stop osearch14 ;
net start osearch14;
4. 重新爬网建立索引。

8.Foxit PDF IFilter 是否支持Windows server 2008 64-bit下的MOSS 2007?
支持。

9.Foxit PDF IFilter 能否实现IpersistStream接口?
可以。

10.我有一个永久许可证,怎么才能把现在试用的许可证转换成永久的呢?如果不重装应用程序,又该怎么做呢?
您只需要在完成购买后,把许可证文件复制到Foxit’s PDF IFilter 的安装文件夹下即可。

11.我应该把Foxit PDF IFilter 安装在MOSS 2007的哪个位置?
您可以把Foxit PDF IFilter 安装在索引服务器上。

12. 当出现“过滤进程无法初始化。请验证文件扩展名是否正确并为已知类型”这样的警告时,我应该怎么做?
这个问题在1.0.0.2405以及以后的版本已经修复。

13. Foxit’s PDF IFilter可以搜索到zip压缩包格式下的PDF文档吗?
如果您想索引ZIP文件格式下的PDF文档,需要安装Zip IFilter和PDF IFilter。由于福昕软件目前只开发了PDF IFilter,请您下载其他公司的Zip IFilter,谢谢。

14. 为什么在微软更新之后,Foxit PDF IFilter无法使用了?需要重新安装吗?
如果您把Foxit PDF IFilter安装在搜索服务器上,在您更新微软后,它将不能使用。因为更新程序自动用Adobe PDF IFilter的注册表值覆盖了Foxit PDF IFilter的注册表值;
您需要重新安装Foxit PDF IFilter 使其正常工作。但是您不需要卸载IFilter,直接运行MSI 程序并选择修复功能即可。我们会联系微软解决这个问题。

15. 在搜索检索日志时,出现以下信息时,应该怎么办?
“已检索(过滤进程不能处理这个项目,这可能是因为您没有这个类型文件的最新过滤器,请安装相关的过滤器并重新检索。”)
请按照以下步骤操作:
1.卸载并重新安装 IFilter;
2.运行 iisreset/noforce;
3.执行net stop osearch 命令(MOSS 2007)或者net stop osearch14(MOSS 2010);
4.执行net start osearch 命令(MOSS 2007)或者net start osearch14(MOSS 2010);
5.开始全文检索。

16. WSS 2 和 WSS 3之间安装的主要区别是什么?
在WSS 2.0服务器上,服务器索引依赖SQL全文索引,因此需要将Foxit PDF IFilter安装并配置在SQL服务器上。而在WSS 3.0 服务器上,WSS索引服务器执行索引功能,则需将其安装并配置在索引服务器上。

17. 我已经将Foxit PDF IFilter安装在WSS下,为什么不能索引PDF文件?
WSS需要在安装Foxit PDF IFilter完后设置额外的注册表信息。请您先添加以下的注册表项,再设置PDF的注册表项值:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\<GUID>\Gather\Search\Extensions\ExtensionList\38。
添加的方法如下:
A. 点击开始菜单中的运行,输入regedit,点击ok。
B. 找到并点击以下注册表子项:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\GUID\Gather\Search\Extensions\ExtensionList;
C. 在编辑菜单上,鼠标指针指向新建,再点击String Value;
D. 输入38,按下回车键;
E. 右击您刚创建注册表项,点击修改;
F. 在Value data 对话框中,键入pdf,点击OK。

18. 为什么无法找到部分PDF 文件?
造成这类问题可能由于以下几个原因:
一. Foxit PDF IFilter 不能索引带密码保护PDF文件。
二. PDF文件没有包括可搜索文本。请您确认在Foxit Reader中是否能用选择文本工具选择文本。或者您是否可以通过进入文本浏览模式选择文本。如果所有的方法都无法选中任何文本,则可能是PDF包含了Foxit PDF IFilter无法索引的图像文本。
三. PDF文件包含的文件没有被正确编码。如果文件中包含有搜索文件,但您仍然无法用搜索工具找到文本,则有可能是文本没有被正确的编码。

19. MOSS 没有默认安装PDF图标,我是否可以自己创建呢?
可以。请在以下网站查询Foxit PDF IFilter for MOSS的安装说明:
https://www.foxitsoftware.cn//products/pdf-ifilter/#tab5

20. 为什么Foxit PDF IFilter 无法在MOSS的索引服务器上搜索CJK字符?
引起此问题的原因可能是因为您的系统没有安装东亚语言包,请按照以下步骤完成安装:
1) 点击开始→控制面板→区域与语言→语言页面。选择“安装复杂脚本文件和语言(包括泰语)”以及“东亚语言文件”→点击“ok”。
2) 安装后,请重启电脑,并在搜索前执行" Start Full Crawl ” 命令。

21. 为什么当我用搜索引擎打开搜索结果的时候,Foxit PDF IFilter 在搜索项中无法跳转到第一项。
PDF IFilter 软件,包括Foxit PDF IFilter都不支持这项功能。Foxit PDF IFilter 只负责提取PDF 文件的属性以及内容,然后返回给搜索引擎。搜索引擎最后调用文本索引来完成索引。如果你需要这个功能,
您可以尝试使用Foxit PDF DLL,这款软件拥有这项功能。

22. 在MOSS下检索PDF文件是否有大小限制?如果有,是什么限制?
Foxit PDF IFilter没有文件大小的限制, 但是系统默认设置是: 最大文件不超过16MB。
您可以添加MAXDOWNLOADSIZE这个key, 修改最大文件限度。具体方法如下:
A. 点击 开始→运行→键入“regedit”→点击“OK”。
B. 找到以下注册表子项:
HKEY_LOCAL_MACHINE\\SOFTWARE\\Microsoft\\Office Server\\12.0\\Search\\Global\\Gathering Manager ;
C. 点击“编辑”→新建→DWORD Value,将它命名为"maxdownloadsize";
D. 双击"maxdownloadsize",选择"Decimal",键入您希望的数值数据;
E. 重启服务器。点击“开始”→运行→输入“cmd”→输入“iisreset”;
F. 在执行搜索前,请先全文检索。

23.我可以将Adobe.gif 文件重命名为 pdficon.gif,并在c:\program files\common files\microsoft shared\web server extensions\12\template\images下更新吗?如果可以,一旦我复制了replacement.gif 文件,是否需要重启服务器?
可以。但是,在复制了replacement.gif 文件后,您需要执行 iisreset命令。您可以通过以下步骤执行:
开始→运行→输入“iisreset”并点击“ok”。您也可以在服务器运行且文件打开的状态下进行更新。

24. 为什么在WSS下,无法索引任何PDF文件?
当Foxit PDF IFilter没有完全安装好时会发生这样的情况,请在重新安装后,执行net stop osearch , net start osearch, net stop spsearch 以及 net start spsearch 命令。

25. 为什么当我把WSS3.0更新为新的Mircosoft Search Server 2008 Express,Foxit PDF IFilter 无法识别PDf 文件?
在安装 Foxit’s PDF IFilter 之后,请重启服务器(请注意仅仅停止或启动搜索服务器和重启IIS 是不够的),再重新执行全文检索SharePoint 服务命令。
新版本的IFilter( IFilter 2.0 )具有过滤PDF文件中类型为PDF的附件,不过默认情况下这个功能没有开启。如果你需要过滤附件,必须到注册表所在位置( HKEY_LOCAL_MACHINE\SOFTWARE\Foxit Software\Foxit PDF IFilter )将FilterAttachFile设置为1。

26. 在IFilter高性能服务器&桌面版本中,怎样使用附件过滤功能?
IFilter 可以在PDF文件中提取PDF格式的附件,但是此功能是默认关闭的。如果您需要过滤附件,请到注册位置(HKEY_LOCAL_MACHINE\SOFTWARE\Foxit Software\Foxit PDF Ifilter),并设置FilterAttachFile为1。

27. 为什么我设置IFilter的日志功能却没有生成日志文件?这个可能由以下几个原因造成:
1. 如果将日志等级设置为1,这个时候只会在错误发生的时候生成日志文件;
2. 某些IFilter的客户程序用户名是local service,为了安全的考虑仅有有限的一些权限,所以生产日志文件失败,你必须将对应文件夹的权限开启为Users用户的写入权限;
3. 如果你设置了自己的日志存放路径,请确保这个路径有效。

28. IFilter新版本能够过滤PDF package文件吗?
可以。只要IFilter开启了附件过滤功能,就能处理PDF packet文件了。所谓的PDF package文件就是由许多PDF类型的附件组成的PDF文件。

29. 用什么工具可以测试IFilter能提取哪些内容?
可以使用 filtreg.exe, filtdump.exe和ifilttst.exe来测试,他们是Windows Server 2003 Resource Kit Tools的一部分。这个工具的描述可以从下面地址了解:
http://msdn.microsoft.com/en-us/library/ms692544(VS.85).aspx
可以从下面地址下载:
http://www.microsoft.com/downloads/details.aspx?familyid=9d467a69-57ff-4ae7-96ee-b18c4790cffd&displaylang=en

30. 拖拽文件夹到一个新的地址,并将新的路径添加到索引地址后,为什么无法找到这个文件夹里的PDF文件呢?
在拖拽文件夹到其它地址后,请右击此文件夹,选择 属性 > 高级 > 勾选选项"快速搜索, 允许索引服务搜索此文件夹",然后再重新索引。这样就能够搜索到该文件夹里的PDF文件了。