АвторСообщение
raindog



ссылка на сообщение  Отправлено: 28.01.08 21:52. Заголовок: Проект новой поисковой


Возможно, не все коллеги следят за обсуждением в соседнем разделе.

С 1 февраля планируется закрытие старой поисковой системы.

Bete_Noire тестирует новую систему здесь: http://mtsearch.hut2.ru/index.php.

Присоединяйтесь к тестированию и обсуждению! Обсуждение в вышеуказанной ветке.

Спасибо: 0 
Профиль Ответить
Ответов - 206 , стр: 1 2 3 4 5 6 7 8 9 10 11 All [только новые]


me-laman



ссылка на сообщение  Отправлено: 29.04.08 20:19. Заголовок: MediaWorm пишет: То..


MediaWorm пишет:

 цитата:
Тоже вроде может пригодиться, но по-моему не обязательное поле, при наличии остальных.



пример:
Человек, Который Знал Слишком Много; Man Who Knew Too Much, The; Альфред Хичкок /Alfred Hitchcock/;
известный факт, фильмов с такими данными два - 1934 и 1956 года. Понятно, что таких примеров не много, но поскольку прецедент создан, то полю ГОД быть, ИМХО. Да и не всегда известен режиссер а фильмов (ремейков) кучи, так что в этом случае поможет только поле ГОД.

MediaWorm пишет:

 цитата:
Но вот если бы прийти к единому языку написанию режиссеров, то поиск по режиссеру был бы предпочтительней, чем по формату.



естественно предпочтительней. Было бы конечно совсем хорошо, если бы было два поля - оригинал и русский вариант, но это, как MediaWorm справедливо заметил не всегда удобно, надо наверное оставить английский вариант. Хотя в своем каталоге у меня на первом месте русский вариант и не всегда имеется оригинальный вариант :)


Спасибо: 0 
Профиль Ответить
me-laman



ссылка на сообщение  Отправлено: 29.04.08 20:26. Заголовок: Bete_Noire пишет: о..


Bete_Noire пишет:

 цитата:
обработанные синонимы будут при поиске учитываться, то есть при поиске Burton будут выводится и Бартон и Бертон.



кто будет устанавливать синонимичность имен? Тут легко ошибиться, да и количество этих синонимов может быть не малым.


Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 29.04.08 20:40. Заголовок: Bete_Noire пишет: в..


Bete_Noire пишет:

 цитата:
вижу это так: три текстовых поля (два названия и режиссер), галочки для форматов. поиск происходит по всем непустым полям. метод поиска - вхождение всех слов в соответствующее поле.

обработанные синонимы будут при поиске учитываться, то есть при поиске Burton будут выводится и Бартон и Бертон.



То что нужно.

me-laman пишет:

 цитата:
Понятно, что таких примеров не много, но поскольку прецедент создан, то полю ГОД быть, ИМХО. Да и не всегда известен режиссер а фильмов (ремейков) кучи, так что в этом случае поможет только поле ГОД.



Я не то что бы против дополнительного поля ГОД. Согласен, в некоторых случаях поможет. Просто не хочется все усложнять. Уверен, что у доброй половины это поле будет пустым.
Если Bete_Noire сделает все так как он это видит, то проблема будет не в том чтобы найти год фильма, а в том, как привлечь людей вносить свои каталоги ( чтоб было у кого искать)
Может щас народ подтянется и предложит еще что-то путное?

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 29.04.08 20:43. Заголовок: так что в этом случа..



 цитата:
так что в этом случае поможет только поле ГОД.


это при условии, что оно будет заполнено. далеко не у всех оно вообще есть. такое поле не будет целесообразно вводить, если у большинства пользователей оно все равно будет пустовать. впрочем контролировать и фильтровать по такому полю легко, мешать тоже не будет.


 цитата:
надо наверное оставить английский вариант.


если запретить вводить кириллицу, то пользователей поисковой еще поубавится, кому захочется переводить все имена на инглиш, если в каталоге только на русском. думаю все же обговорить этот момент в требованиях к спискам (предпочтение к английскому), а если возможности вводить английские имена нет, использовать синонимы.


 цитата:
кто будет устанавливать синонимичность имен?


вопрос конечно интересный, мне этим заниматься совсем не хочется, как думаю и кому-либо другому. вообще речь шла о том, чтобы
 цитата:
функционально предусмотреть возможность приравнивания

на будущее. теоретически этот должен делать админ/модератор.

у кого-нибудь есть идеи для обеспечения адекватного поиска по режиссеру получше?

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 29.04.08 21:19. Заголовок: Bete_Noire пишет: у..


Bete_Noire пишет:

 цитата:
у кого-нибудь есть идеи для обеспечения адекватного поиска по режиссеру получше?



Можно сделать вместо трех текстовых полей четыре. Русское название - Оригинальное название - Режиссер на русском - Режиссер в оригинале.
у кого в каталоге режиссеры на русском - 4-ю колонку не заполняют, и наоборот

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 29.04.08 21:27. Заголовок: проблема, как я ее в..


проблема, как я ее вижу, заключается не столько в языке, сколько в возможных вариациях перевода имен и фамилий на русский

Спасибо: 0 
Профиль Ответить
me-laman



ссылка на сообщение  Отправлено: 29.04.08 21:50. Заголовок: MediaWorm пишет: у ..


MediaWorm пишет:

 цитата:
у кого в каталоге режиссеры на русском - 4-ю колонку не заполняют, и наоборот



ну и например я начинаю искать фильмы режиссера Bergman, Ingmar будут ли в выборку попадать фильмы режиссера Бергман, Ингмар? При условии что в одном списке заполнено только поле №4, а в другом наоборот. Т.е. кто будет устанавливать соответствие Bergman, Ingmar = Бергман, Ингмар? Приходим к той же синонимичности. В общем вопрос не простой и с ходу не решится, думаю будет достаточно, для меня по крайней мере, простое наличие поля Режиссер даже без возможности поиска по этому полю.

А на счет года, о я знаю несколько коллекционеров для которых год выхода фильма является определяющим фактором и наличие этого поля, и поиска по нему, а также поиска по некоторому периоду для них просто необходимо.

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 30.04.08 00:02. Заголовок: Суть того, что я пре..


Суть того, что я предлагал.
Имеем 4 текстовых поля - Русское название - Оригинальное название - Режиссер на русском - Режиссер в оригинале
Если нужно найти фильмы Бергмана, забиваем в поле Режиссер в оригинале - Bergman (без имени) и получаем фильмы всех Bergman-ов-режиссеров.
Если ничего не нашли или недовольны результатом, забиваем в поле Режиссер на русском - Бергман (без имени) и получаем фильмы всех Бергманов-режиссеров.
Имя стоит исключить хотя бы из-за возможных ошибок в написании или опечаток. Вряд ли найдется много однофамильцев.

Понятно, что не все фамилии режиссеров так просты в написании. Но если подумать, откуда в каталогах трейдеров берутся эти фамилиии и имена? Из каких-то открытых источников (киносайты, каталоги других трейдеров, интернет-магазины). То есть по сути все друг у друга копируют информацию о фильмах, значит у всех приблизительно одни и те же названия фильмов и имена режиссеров ( просто кто-то пользуется русским вариантом, а кто-то английским ). Вряд ли кто-то переводит сам. Сравнил несколько каталогов с русскоязычным написанием режиссеров - практически один к одному. Значит человек найдет своего IMAMURA Shohei или ИМАМУРА Сёхэй.


Идеальный вариант - это конечно с одной графой Режиссер. Но тут уже придется составлять базу "возможных вариаций перевода имен и фамилий на русский" , которую надо время от времени обновлять и редактировать.
На вскидку это где-то 2000 популярных режиссеров. В базе TVGuru - это 23911 человек. На IMDB - лучше не знать.
Попробовать, конечно, можно, но как по мне, так лучше первый вариант. Если конечно такую базу можно где-нибудь достать, дело другое.

Спасибо: 0 
Профиль Ответить
me-laman



ссылка на сообщение  Отправлено: 30.04.08 07:48. Заголовок: Не знаю как у кого, ..


Не знаю как у кого, а уменя в каталоге режиссеры с именем. И как отделять одно от другого я не знаю, а точнее говоря просто не хочу. Может Bete_Noire сможет сделать что-либо подобное тому что есть на муз поиске? Поиск по частичному совпадению имен и Ингмар Бергман найдется если искать и просто "Бергман" и "Ингмар Бергман", и "Бергман, Ингмар"? Такой вариант решил бы многие проблемы.

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 30.04.08 14:58. Заголовок: me-laman пишет: Не ..


me-laman пишет:

 цитата:
Не знаю как у кого, а уменя в каталоге режиссеры с именем. И как отделять одно от другого я не знаю, а точнее говоря просто не хочу.



Так тебе отделять и не надо. Просто скопировать в две колонки одно и тоже.

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 30.04.08 16:02. Заголовок: 2me-laman Т.е. кто б..


2me-laman

 цитата:
Т.е. кто будет устанавливать соответствие Bergman, Ingmar = Бергман, Ингмар?


пока не знаю кто, но если мы примем вариант с синонимами, делать это придется вручную. то есть давать пользователю ввести все, что он хочет, а админу/модеру придется сидеть и приравнивать одно имя другому. перспектива, скажу вам, не очень...


 цитата:
думаю будет достаточно, для меня по крайней мере, простое наличие поля Режиссер даже без возможности поиска по этому полю.


думаю тут будет много возражений, я и сам обычно если и ищу фильмы, то конкретного режиссера. поиск по режиссеру нужен, осталось понять как обеспечить нормальную выдачу конечному пользователю.


 цитата:
А на счет года,


с годом решили, году быть!


 цитата:
Поиск по частичному совпадению имен


в муз поиске реализован алгоритм "вхождение всех искомых слов в поле". в видео планирую сделать то же. то есть "Бергман, Ингмар" и "Ингмар Бергман" будут находится по "Бергман" и/или по "Ингмар". пунктуацию можно будет вырезать (кстати!), так что от перестановки слов местами ничего не изменится, то есть "Бергман, Ингмар" = "Ингмар Бергман"

2MediaWorm

 цитата:
Режиссер в оригинале


а какие-нибудь немецкие, финские или, еще хуже, японские режиссеры в оригинале как будут выглядеть? если и заводить такое поле, то именно режиссер на английском (латиницей по крайней мере, перевод дело вольное).


 цитата:
Идеальный вариант - это конечно с одной графой Режиссер. Но тут уже придется составлять базу "возможных вариаций перевода


я тоже склоняюсь к одному полю. прочитал тут небольшую статейку, появиласть одна идея. возможная панацея - полнотекстовый поиск (fulltext search), буду еще разбираться что это и поддерживается ли сервером. если кто пользовался отпишите.

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 30.04.08 16:11. Заголовок: Bete_Noire пишет: е..


Bete_Noire пишет:

 цитата:
если и заводить такое поле, то именно режиссер на английском (латиницей по крайней мере, перевод дело вольное).



Я это и имел в виду.

Спасибо: 0 
Профиль Ответить
me-laman



ссылка на сообщение  Отправлено: 30.04.08 18:16. Заголовок: а может не лепить дв..


а может не лепить два поля по режиссеру, а раз будет "вхождение всех искомых слов в поле" разрешить писать что-то типа: "Теренс Янг /Terence Young/" или в скобках это кому как удобно и тогда будет возможен поиск и по оригинальному (латиницей) имени и по русскому варианту.

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 30.04.08 22:01. Заголовок: http://media-ex.com/..


http://media-ex.com/video.php

вот набросал грубо, пока без превязки к конкретному пользователю, чтобы опробовать сам поиск.

залейте свои листы, опробуйте.

поиск поисходит, как и планировалось, по любым не пустым полям. ищется вхождение всех слов/обрывков слов (кроме формата, он ищется по ИЛИ). пока никаких ограничений на длину запроса нет, хоть по одной букве. про режиссера ничего путного в голову так и не пришло, сделал одно поле, вводите что хотите )

добавлено:
обязательным является только одно из названий, остальные поля опциональные

добавлено:
если в формате есть вхождение dvd, то формат dvd
если в формате есть вхождение hdtv, то формат hdtv
иначе mpeg

длина полей: режиссер 100 символов, названия по 60, год 4

Спасибо: 0 
Профиль Ответить
me-laman



ссылка на сообщение  Отправлено: 01.05.08 17:49. Заголовок: Ну что, мне нравится..


Ну что, мне нравится. Единственно хотелось бы чтобы в базе сохранялось первоначальное значение формата для DVD. А то двд-5 двд9 и пр. радости сливаются в безликое DVD ну а в прочем все ОК.

добавлено:
обнаружил... ввел в поиск "Man Who Knew Too Much, The" таких фильмов у меня в списке два (проверял, точно два) а впоисковой вышел только один34 года. Вопрос, куда делся второй - 54 года?


Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 01.05.08 19:18. Заголовок: Мне тоже нравится. В..


Мне тоже нравится. Вроде как работает.

Если не поможет полнотекстовый поиск (fulltext search), вариант с двумя полями режиссера для начала бы точно сгодился.

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 01.05.08 19:39. Заголовок: Единственно хотелось..



 цитата:
Единственно хотелось бы чтобы в базе сохранялось первоначальное значение формата для DVD


для унификации выдачи, хотелось бы все же ввести ограничение на формат. на данный момент предусмотрено:
HDTV
DVD
DVD5
DVD9
MPEG

еще думаю надо добавить 2xDVD5 и 2xDVD9. остальные варианты, как я подозреваю, очень редки.

из названий фильмов будут удаляться любой текст в скобках, например "[2 DVD]"


 цитата:
куда делся второй - 54 года?


поправил (пока на оффлайновом сервере). поле год не учавствовало в определении уникальности фильма, поэтому второй удалялся при вносе.


 цитата:
Если не поможет полнотекстовый поиск


не поможет. режиссер все равно будет один, но в него можно будет вводить русский, английский варианты или оба по желанию. длина поля 80 сиволов.

добавлено:

временный поиск прикрыл, начинаю внедрять вариант более близкий к реальности

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 01.05.08 19:46. Заголовок: Bete_Noire пишет: и..



 цитата:
из названий фильмов будут удаляться любой текст в скобках, например "[2 DVD]"


А это еще зачем?

В таком названии " Плутовство ( Хвост Виляет Собакой ) " все останется? . Это два варианта перевода




 цитата:
режиссер все равно будет один, но в него можно будет вводить русский, английский варианты или оба по желанию. длина поля 80 сиволов.



Нормально.

Спасибо: 0 
Профиль Ответить
Bete_Noire



ссылка на сообщение  Отправлено: 01.05.08 20:03. Заголовок: А это еще зачем? зат..



 цитата:
А это еще зачем?


затем, что у некоторых трейдеров в названиях фильмов находится еще и формат/количество двд.


 цитата:
В таком названии " Плутовство ( Хвост Виляет Собакой ) " все останется?



в том виде, как это есть на данный момент, нет. но надо будет поправить, чтобы удялялся только текст, похожий на формат.

Спасибо: 0 
Профиль Ответить
MediaWorm



ссылка на сообщение  Отправлено: 01.05.08 20:13. Заголовок: Bete_Noire пишет: з..


Bete_Noire пишет:

 цитата:
затем, что у некоторых трейдеров в названиях фильмов находится еще и формат/количество двд.



У меня именно так и есть. Это мешает нормальной работе поисковика?

Спасибо: 0 
Профиль Ответить
Ответов - 206 , стр: 1 2 3 4 5 6 7 8 9 10 11 All [только новые]
Тему читают:
- участник сейчас на форуме
- участник вне форума
Все даты в формате GMT  3 час. Хитов сегодня: 6
Права: смайлы да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация откл, правка нет



Создай свой форум на сервисе Borda.ru
Текстовая версия