Новые возможности полнотекстового поиска в PostgreSQL / Олег Бартунов (Postgres Professional)

Приглашаем на конференцию Saint HighLoad++ 2024, которая пройдет 24 и 25 июня в Санкт-Петербурге!
Программа, подробности и билеты по ссылке: vk.cc/cuyIqx
--------
--------
Презентация и тезисы:
www.highload.ru/2016/abstracts...
Я расскажу про новые возможности полнотекстового поиска, которые вошли в последний релиз PostgreSQL - поддержку фразового поиска и набор функций для манипулирования полнотекстовым типом данных (tsvector). Помимо этого, мы улучшили поддержку морфологических словарей, что привело к значительному увеличению числа поддерживаемых языков, оптимизировали работу со словарями, разработали новый индексный метод доступа RUM, который значительно ускорил выполнение ряда запросов с полнотекстовыми операторами.
...

Пікірлер: 19

@artemtema57646 жыл бұрын
Через 20 лет он будет как магистр Йода)
@eugeneus77
6 жыл бұрын
Он уже ;) Ну как бы считается что я вроде как знаю что-то про Postgres. Но вот он явно знает намнооооого больше
@AlexSan4ez82
Жыл бұрын
Осталось подождать 15 лет 🤓
@alastor7825 жыл бұрын
Я всё ждал когда он сядет в лотос и продолжит презентацию таким образом.
@kl45gp Жыл бұрын
офигенно рассказывает!, как обычно)
@andriirubtsov54046 жыл бұрын
Зачетный мужик
@user-rs1lw2gg8l6 жыл бұрын
Отлично!
@RaceForMoney7 жыл бұрын
О! Земляк! Заебись!
@antoniolukinidi1917
5 жыл бұрын
А без мата не получается обрадоваться?! Не позорь земляка.
@savel2work4 жыл бұрын
Главное, чего не сказал докладчик: полнотекстовый поиск в базе данных очень полезен для относительно мелких проектов, которые не могут позволить себе Эластиксёрч или Сфинкс. Например, для некоммерческого сайта, который крутится на виртуальном сервере с одним гигом оперативы.
@romanshilov2748
4 жыл бұрын
Savel MTRX почему? Очень долго работает на больших объемах данных?
@savel2work
4 жыл бұрын
@@romanshilov2748, всё очень просто. На таких микросерверах подобный поиск просто не запустится) Памяти ява-машине не хватит)))) К слову, вспомнилось: Solr и Elasticsearch основаны на Lucene, у которой есть интересный недостаток: строка не может содержать более 32766 байтов. Насколько знаю, это захардкожено в Люцене. В общем, делал форум один, там были мощные такие лонгриды, и Solr просто отказался его индексировать. Postgres же работает нормально, весьма быстро причём.
@romanshilov2748
4 жыл бұрын
Savel MTRX спасибо)
@DemolExpert
4 жыл бұрын
@@savel2work В ластике есть keyword и text, где keyword - это string datatype для хранения структурированной информации, которую можно искать через filter, а вот text - туда можно пихать огромныеее тексты, который вам режет текст на термы. Возможно, вы имели, что длина терма одного весит 32766 байт? :)
@savel2work
4 жыл бұрын
@@DemolExpert, да, именно эти "куски" имелись в виду. Но если Ластик, видимо, сам тексты режет на части, то вот Солр с такой задачей не справился)
@zxcq2 жыл бұрын
До сих пор удивляюсь что всё о чем он рассказывает написано на С, а не на С++, java и т.д.
@user-vn2nx1yq9e2 жыл бұрын
индеец какой то
@lisafox90265 жыл бұрын
12 минут а ничего полезного не услышала..

Новые возможности полнотекстового поиска в PostgreSQL / Олег Бартунов (Postgres Professional)

Пікірлер: 19

@eugeneus77

6 жыл бұрын

@AlexSan4ez82

Жыл бұрын

@antoniolukinidi1917

5 жыл бұрын

@romanshilov2748

4 жыл бұрын

@savel2work

4 жыл бұрын

@romanshilov2748

4 жыл бұрын

@DemolExpert

4 жыл бұрын

@savel2work

4 жыл бұрын

Келесі