Обсуждение работы программы
|
|
drserj | Дата: Понедельник, 26.06.2017, 21:04 | Сообщение # 1576 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) "только fb2" может для фильтра : "содержит fb2" - тогда не учитывается регистр... Но это долго... х.е.з. надо импортировать базу, тогда скажу сколько фб2 в базе (для либруса, как я понял?)
drSerj
|
|
| |
drserj | Дата: Понедельник, 26.06.2017, 22:29 | Сообщение # 1577 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата surgutian ( ) В списке на http://lib.rus.ec/sql/ сегодня пропали файлыlibgenremeta.sql и 2017-06-xx.libgenremeta.sql. Снова приплыли..? Очередное улучшательство от либруса. Что самое смешное - изменение "ниочем"... И не флибуста и не либруспро... объединили две таблицы, дали другое название... в итоге для базы - абсолютный ноль разницы.
Завтра постараюсь переделать модуль импорта. Любителям и знатокам базового SQL - на 5 минут работы, можете сами поправить.
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 14:46 | Сообщение # 1578 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| Цитата для либруса, как я понял? Нет, для флибусты. Либрус я пока удалил
|
|
| |
drserj | Дата: Вторник, 27.06.2017, 19:47 | Сообщение # 1579 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) Нет, для флибусты. Либрус я пока удалил ок. это проще, у меня полное собрание сочинений в наличии чуть позже попробую сделать выборку и скажу точно, что есть а чего нет.
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 20:06 | Сообщение # 1580 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| А теперь самый интересный вопрос.. ) Если я закачаю сейчас либрус и перегоню его в MD5, далее скопирую содержимое в в ту же папку, где живет Флибуста, могу же я рассчитывать, что дублей по MD5 не будет? И у меня будет одна база на две библиотеки?)
Сообщение отредактировал jornada - Вторник, 27.06.2017, 20:08 |
|
| |
drserj | Дата: Вторник, 27.06.2017, 20:13 | Сообщение # 1581 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) могу же я рассчитывать, что дублей по MD5 не будет? И у меня будет одна база на две библиотеки?) конечно. И я даже хотел такое сделать. Остановила мелкая подлость со стороны либруса - они в огромном количестве книг внесли мелкие и нах никому не нужные изменения - или пробел, или ентер. Казалось бы да и хрен с ним, но у этих файлов уже совсем другой мд5. Т.е. у тебя фактически будет толпа дублей, кажущихся разными книгами. Но, как показала практика, интересного, что есть на либрусе и нет на флибусте, в общем-то нет.
Я даже делал ради прикола выборку расхождений по мд5 (всего один запрос). Можно тупо докачать то, чего нет на флибусте.
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 20:16 | Сообщение # 1582 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| Ну если расхождения минимальны ( не в плане добавленных пробелов, а по сути) тогда, конечно, смысла нет.. а жаль)
|
|
| |
drserj | Дата: Вторник, 27.06.2017, 20:19 | Сообщение # 1583 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) Ну если расхождения минимальны в том-то и дело... подозреваю, что сделано было исключительно для "уникальности книги"
как вариант - можно, в большинстве своем, сделать отбор подобных "шедевров", но овчинка выделки не стоит. впрочем, как я уже сказал, легко сделать выборку и оценить надобность скачки либруса.
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 20:23 | Сообщение # 1584 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| Цитата как вариант - можно, в большинстве своем, сделать отбор подобных "шедевров", но овчинка выделки не стоит. впрочем, как я уже сказал, легко сделать выборку и оценить надобность скачки либруса. А можно скрипт на выборку? Посмотреть разницу. Если ради эксперимента.. можно конечно функцию написать, которая будет удалять из текста пробелы и переводы строки, а после этого считать хэш.. и посмотреть что получится в итоге
|
|
| |
drserj | Дата: Вторник, 27.06.2017, 20:45 | Сообщение # 1585 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) А можно скрипт на выборку? сейчас допилю плаг либруса, который опять "обновился" и набросаю...
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 20:48 | Сообщение # 1586 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| А еще можно попробовать реализовать алгоритм поиска нечетких дубликатов) я правда никогда с mysql не работал.. но могу все на ms sql утянуть) подключить пару сборок и всю библу в файлстрим запихать)
|
|
| |
drserj | Дата: Вторник, 27.06.2017, 20:53 | Сообщение # 1587 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| так, что-то типа SELECT bookid FROM flibusta.mlbook WHERE MD5 NOT IN (SELECT MD5 FROM librus.mlbook)
Ну, flibusta и librus - имена баз в программе, у тебя могут быть другие... в этом запросе - выбираем все записи из флибусты, мд5 которых нет в либрусе ну а если наоборот выбираем все записи из либруса, мд5 которых нет в флибусте SELECT bookid FROM librus.mlbook WHERE MD5 NOT IN (SELECT MD5 FROM flibusta.mlbook)
drSerj
|
|
| |
drserj | Дата: Вторник, 27.06.2017, 20:54 | Сообщение # 1588 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата jornada ( ) подключить пару сборок и всю библу в файлстрим запихать) жесть, однако когда первую библиотеку делал - тоже аналогичное впихал, потом понял - горе
drSerj
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 21:29 | Сообщение # 1589 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| Цитата жесть, однако когда первую библиотеку делал - тоже аналогичное впихал, потом понял - горе Ну так это временно.. поиздеваться над содержимым. В родной среде оно как то привычнее. Потом можно обратно выгрузить, а можно и нет.. еще мобильное приложение написать и всем раздать) На самом деле это фантазии, никто оособо не заинтересован, посему вряд ли..
|
|
| |
jornada | Дата: Вторник, 27.06.2017, 21:34 | Сообщение # 1590 |
Рядовой
Группа: Пользователи
Сообщений: 15
Статус: Offline
| Цитата Кстати, как там вирус, до вас еще не докатился? Какой такой вирус?
|
|
| |