Cautare in pdf uri + mobileapp

Salut,

Se da o multitudine de fisiere pdf, asezate frumos intr-un cloud.
Se da ca inspiratie modelul Adobe prin comanda de cautare simultan in multiple fisiere, aflate intr un director de pe computer.
Se da tema de proiect realizarea unui mobileapp (android & ios) ptr. afisarea textelor / zonelor de text in care se afla termenul / cuvantul din campul de cautare, fara afisarea intregului fisier.

Intrebare: care e cea mai avantajoasa metoda & cale de a duce la bun sfarsit tema proiectului? Tntsearch. Algolia si Firestore…

Numai bine!

În funcție de dimensiunea documentelor, algolia poate fi destul de scump. Dar dacă te încadrezi în 10k documente a maximum 10kb fiecare, Algolia este gratuit.

Algolia (sau firestore sau orice altceva) nu știe să caute în PDF, deci trebuie să extragi informația din documente. Eu am folosit Tika și a mers foarte bine, mai ales că eu aveam și documete scanate. :slight_smile:

Am folosit Algolia și Swiftype, ambele știu să facă highlight la cuvintele căutate, știu operatori logici, faceting, typo tolerance etc.

2 Likes

Ar mai fi și solr și ripgrep-all

1 Like