Новые возможности полнотекстового поиска в PostgreSQL / Олег Бартунов (Postgres Professional)
Приглашаем на конференцию Saint HighLoad++ 2024, которая пройдет 24 и 25 июня в Санкт-Петербурге!
Программа, подробности и билеты по ссылке: vk.cc/cuyIqx
--------
--------
Презентация и тезисы:
www.highload.ru/2016/abstracts...
Я расскажу про новые возможности полнотекстового поиска, которые вошли в последний релиз PostgreSQL - поддержку фразового поиска и набор функций для манипулирования полнотекстовым типом данных (tsvector). Помимо этого, мы улучшили поддержку морфологических словарей, что привело к значительному увеличению числа поддерживаемых языков, оптимизировали работу со словарями, разработали новый индексный метод доступа RUM, который значительно ускорил выполнение ряда запросов с полнотекстовыми операторами.
...
Пікірлер: 19
Через 20 лет он будет как магистр Йода)
@eugeneus77
6 жыл бұрын
Он уже ;) Ну как бы считается что я вроде как знаю что-то про Postgres. Но вот он явно знает намнооооого больше
@AlexSan4ez82
Жыл бұрын
Осталось подождать 15 лет 🤓
Я всё ждал когда он сядет в лотос и продолжит презентацию таким образом.
офигенно рассказывает!, как обычно)
Зачетный мужик
Отлично!
О! Земляк! Заебись!
@antoniolukinidi1917
5 жыл бұрын
А без мата не получается обрадоваться?! Не позорь земляка.
Главное, чего не сказал докладчик: полнотекстовый поиск в базе данных очень полезен для относительно мелких проектов, которые не могут позволить себе Эластиксёрч или Сфинкс. Например, для некоммерческого сайта, который крутится на виртуальном сервере с одним гигом оперативы.
@romanshilov2748
4 жыл бұрын
Savel MTRX почему? Очень долго работает на больших объемах данных?
@savel2work
4 жыл бұрын
@@romanshilov2748, всё очень просто. На таких микросерверах подобный поиск просто не запустится) Памяти ява-машине не хватит)))) К слову, вспомнилось: Solr и Elasticsearch основаны на Lucene, у которой есть интересный недостаток: строка не может содержать более 32766 байтов. Насколько знаю, это захардкожено в Люцене. В общем, делал форум один, там были мощные такие лонгриды, и Solr просто отказался его индексировать. Postgres же работает нормально, весьма быстро причём.
@romanshilov2748
4 жыл бұрын
Savel MTRX спасибо)
@DemolExpert
4 жыл бұрын
@@savel2work В ластике есть keyword и text, где keyword - это string datatype для хранения структурированной информации, которую можно искать через filter, а вот text - туда можно пихать огромныеее тексты, который вам режет текст на термы. Возможно, вы имели, что длина терма одного весит 32766 байт? :)
@savel2work
4 жыл бұрын
@@DemolExpert, да, именно эти "куски" имелись в виду. Но если Ластик, видимо, сам тексты режет на части, то вот Солр с такой задачей не справился)
До сих пор удивляюсь что всё о чем он рассказывает написано на С, а не на С++, java и т.д.
индеец какой то
12 минут а ничего полезного не услышала..