Apache Solr

Nejlepší vyhledávače s vlastním hostitelem

Nejlepší vyhledávače s vlastním hostitelem
Ví váš šéf, že hledáte jinou práci? Řekli jste svému blízkému o neschopnosti rozhodnout se, zda chcete mít děti nebo ne? Vy rodiče víte o své sexuální orientaci?? Google a další hlavní vyhledávače ano.

„Většina uživatelů vyhledává na Googlu, když je přihlášena, takže jsou k dispozici všechny informace o jejich online životě: vyhledávání na YouTube, e-maily a minulá historie vyhledávání,“ říká Adam Tauber, hlavní vývojář metasearchového enginu respektujícího soukromí Searx.

Samozřejmě můžete použít Tor pro anonymitu a po každém hledání vždy smazat všechny stopy své aktivity, ale pokud to uděláte po každém vyhledávání, s největší pravděpodobností docela rychle zestárne. Místo toho byste měli zvážit instalaci samoobslužného vyhledávače schopného získat informace za vás, aniž byste o sobě prozradili něco citlivého.

Vybrali jsme dva takové vyhledávače a představili jsme také tři další vyhledávače, abychom vám ukázali, že vynikající alternativy k proprietárním vyhledávačům, jako je Google nebo Bing, již existují a jejich instalace a použití je snazší, než si možná myslíte.

1. YaCy

YaCy je bezplatný distribuovaný peer-to-peer vyhledávač, jehož základní komponenta je napsána v Javě. Protože všichni uživatelé YaCy jsou si rovni a protože vyhledávač neukládá požadavky na vyhledávání uživatelů, cenzura prostě není možná.

V současné době YaCy indexuje přibližně 1.4 miliardy dokumentů ve svém indexu díky aktivitě více než 600 peer operátorů, kteří do něj každý měsíc přispívají. Pro srovnání obsahuje index Vyhledávání Google stovky miliard webových stránek a jeho velikost přesahuje 100 000 000 gigabajtů.

Zatímco YaCy čeká ještě dlouhá cesta, než bude moci konkurovat největším centralizovaným vyhledávačům na světě, je již použitelný jako vyhledávací portál pro soukromé intranety a aplikace specifické pro projekt, protože YaCy může fungovat jako jediné vyhledávací zařízení bez připojení k síti s jinými vrstevníci.

YaCy lze snadno integrovat do jakékoli webové stránky díky svým jednoduchým fragmentům kódu, které lze bez jakékoli námahy kopírovat a vkládat.

2. Searx

Searx je popisován jako hackerský metasearch engine respektující soukromí. Je k dispozici pod GNU Affero General Public License verze 3 a jeho hlavním cílem je chránit soukromí svých uživatelů tím, že nikdy nesdílí IP adresy uživatelů ani historii vyhledávání s vyhledávači, ze kterých shromažďuje výsledky.

„Když používáte Searx, IP adresa Searxu, náhodného User-Agenta a vyhledávacího dotazu se standardně odesílá do Googlu,“ vysvětluje Adam Tauber, aka asciimoo, jak funguje jeho metasearch engine. "Samozřejmě můžete přizpůsobit Searx tak, aby předával další další parametry, jako je jazyk vyhledávání nebo číslo stránky požadované stránky s výsledky.".“

Searx automaticky blokuje všechny sledovací soubory cookie poskytované vyhledávacími stroji, aby se zabránilo úpravě výsledků založených na profilování uživatelů, což může být výsledkem toho, že se vyhledávač pokusí implementovat vyhledávání, které je individualizováno podle toho, co motor o uživateli ví. Searx je stoprocentně zdarma a každý jej může podle potřeby upravit. Dokonce si můžete vzít kód Searx a spustit metasearch engine na svém vlastním serveru, který by měl určitě řešit jakékoli obavy, které byste mohli mít ohledně protokolů.

3. Elastické vyhledávání

ElasticSearch je vyhledávač založený na Lucene, bezplatné a otevřené softwarové knihovně pro získávání informací podporované Apache Software Foundation a je vydáván pod licencí Apache Software License.

ElasticSearch poskytuje fulltextový vyhledávač s webovým rozhraním HTTP. Vyhledávací stroj lze použít k prohledávání všech druhů dokumentů a lze jej snadno distribuovat na více uzlů.

Je možné sestavit vyhledávač s vlastním hostitelem pomocí ElasticSearch a Docker a zde najdete návod, který popisuje postup.

4. Ambar

Ambar je open-source vyhledávač dokumentů s mnoha užitečnými funkcemi. Podporuje automatické procházení, označování a okamžité fulltextové vyhledávání, abychom uvedli jen několik příkladů. Jednou z nejzajímavějších funkcí Ambaru je jeho schopnost provádět OCR na obrázcích a souborech PDF. Mezi podporované jazyky patří angličtina, němčina, ruština, italština, francouzština, španělština, polština a holandština.

Ambar lze snadno nasadit pomocí jednoho souboru docker-compose a zde se naučíte, jak to udělat.

5. Apache Solr

Apache Solr, napsaný v jazyce Java, je platforma podnikového vyhledávání, která zahrnuje fulltextové vyhledávání, zvýraznění zásahů, fazetové vyhledávání, indexování v reálném čase, dynamické shlukování a mnoho dalších důležitých funkcí. Byl vytvořen v roce 2004 pro vlastní projekt ve společnosti CNET Networks. Společnost CNET Networks ji laskavě darovala Apache Software Foundation v roce 2006, kde v roce 2007 promovala ze stavu inkubace na samostatný projekt nejvyšší úrovně.

Dnes je Solr vysoce spolehlivá, škálovatelná a odolná vůči chybám podniková platforma pro vyhledávání, která podporuje vyhledávací a navigační funkce mnoha největších světových internetových stránek, včetně DuckDuckGo, eHarmony a BestBuy. Můžeš

Jak nainstalovat a konfigurovat YaCy

Instalace YaCy je velmi jednoduchá a trvá jen pár minut, protože nemusíte instalovat externí databázi nebo webový server - YaCy je dodáván se vším potřebným.

  1. Přejděte na oficiální web YaCy a stáhněte si nejnovější balíček pro Linux.
  2. Nainstalujte běhové prostředí OpenJDK 8.
    • Pokud používáte distribuci založenou na Debianu, použijte následující příkaz: $ sudo apt-get install openjdk-8-jre
    • Pokud ne, postupujte podle pokynů pro vaši distribuci.
  3. Rozbalte stažený balíček do požadovaného umístění.
  4. Přejděte do nové složky a spusťte „startYACY.sh ”skript v Terminálu.
  5. Měla by se zobrazit potvrzovací zpráva s informací, že YaCy začal jako démon

Závěr

Vyhledávače o nás vědí víc, než by si většina lidí přála. Pokud byste chtěli přestat krmit velké společnosti šťavnatými daty, můžete vzít věci do svých rukou a nastavit si vlastní vyhledávač, který chrání vaše soukromí. Přestože vyhledávací automaty s vlastním hostitelem mají před sebou ještě dlouhou cestu, aby se staly plně použitelnými, existuje potenciál pro jejich překonání, jako je Google, a jeho zachycení je pouze otázkou přilákání více uživatelů.

Recenze bezdrátové myši Microsoft Sculpt Touch
Nedávno jsem četl o Microsoft Sculpt Touch bezdrátová myš a rozhodl se ji koupit. Po chvíli používání jsem se rozhodl se s ním podělit o své zkušenost...
Trackpad a ukazatel myši AppyMouse na obrazovce pro tablety Windows
Uživatelé tabletů často postrádají ukazatel myši, zejména když obvykle používají notebooky. Dotykové smartphony a tablety mají mnoho výhod a jediným o...
Střední tlačítko myši nefunguje ve Windows 10
The prostřední tlačítko myši pomáhá procházet dlouhé webové stránky a obrazovky se spoustou dat. Pokud se to zastaví, budete nakonec používat klávesni...