Skip to content

Arandott/812-scholar

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

812 Scholar

这是一个信息检索系统课程的大作业,课程链接:Information Retrieval CUFE。本项目的功能是根据用户输入,从1000篇PDF文档中检索到相关的文档。

技术栈

  • Java
  • Spring Boot
  • Grobid
  • Maven

安装指南

  1. 克隆项目

    git clone https://github.com/Arandott/812-scholar
    cd 812-scholar
  2. 创建项目

    确保已安装 Maven 和 JDK。

    mvn clean install
  3. 预处理PDF文档

    使用grobid将论文pdf转化成xml文件格式

    ./process_pdfs.sh
    
  4. 建立索引

    在第一次运行前,需要对文档集合进行索引:

    java -cp target/你的项目.jar com.example.LuceneIndexer /path/to/documents

    请将 /path/to/documents 替换为实际的文档目录。

  5. 启动应用

    mvn spring-boot:run

    应用将运行在 http://localhost:8083/。

贡献者

  • 陈宝文
  • 张弛
  • 宋明坤

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published