LibRusLib
Воскресенье, 01.12.2024, 06:44
Приветствую Вас Гость | RSS
 
Главная ФорумРегистрацияВход
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
Обсуждение работы программы
drserjДата: Понедельник, 26.06.2017, 21:04 | Сообщение # 1576
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
"только fb2"
может для фильтра : "содержит fb2" - тогда не учитывается регистр... Но это долго... х.е.з. надо импортировать базу, тогда скажу сколько фб2 в базе (для либруса, как я понял?)


drSerj
 
drserjДата: Понедельник, 26.06.2017, 22:29 | Сообщение # 1577
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата surgutian ()
В списке на http://lib.rus.ec/sql/ сегодня пропали файлыlibgenremeta.sql и 2017-06-xx.libgenremeta.sql.
Снова приплыли..?

Очередное улучшательство от либруса. Что самое смешное - изменение "ниочем"... И не флибуста и не либруспро... объединили две таблицы, дали другое название... в итоге для базы - абсолютный ноль разницы.

Завтра постараюсь переделать модуль импорта. Любителям и знатокам базового SQL - на 5 минут работы, можете сами поправить. smile


drSerj
 
jornadaДата: Вторник, 27.06.2017, 14:46 | Сообщение # 1578
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
Цитата
для либруса, как я понял?

Нет, для флибусты. Либрус я пока удалил
 
drserjДата: Вторник, 27.06.2017, 19:47 | Сообщение # 1579
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
Нет, для флибусты. Либрус я пока удалил

ок. это проще, у меня полное собрание сочинений в наличии smile чуть позже попробую сделать выборку и скажу точно, что есть а чего нет.


drSerj
 
jornadaДата: Вторник, 27.06.2017, 20:06 | Сообщение # 1580
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
А теперь самый интересный вопрос.. ) Если я закачаю сейчас либрус и перегоню его в MD5, далее скопирую содержимое в в ту же папку, где живет Флибуста, могу же я рассчитывать, что дублей по MD5 не будет? И у меня будет одна база на две библиотеки?)

Сообщение отредактировал jornada - Вторник, 27.06.2017, 20:08
 
drserjДата: Вторник, 27.06.2017, 20:13 | Сообщение # 1581
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
могу же я рассчитывать, что дублей по MD5 не будет? И у меня будет одна база на две библиотеки?)

конечно. И я даже хотел такое сделать. Остановила мелкая подлость со стороны либруса - они в огромном количестве книг внесли мелкие и нах никому не нужные изменения - или пробел, или ентер. Казалось бы да и хрен с ним, но у этих файлов уже совсем другой мд5. Т.е. у тебя фактически будет толпа дублей, кажущихся разными книгами. Но, как показала практика, интересного, что есть на либрусе и нет на флибусте, в общем-то нет. 

Я даже делал ради прикола выборку расхождений по мд5 (всего один запрос). Можно тупо докачать то, чего нет на флибусте.


drSerj
 
jornadaДата: Вторник, 27.06.2017, 20:16 | Сообщение # 1582
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
Ну если расхождения минимальны ( не в плане добавленных пробелов, а по сути) тогда, конечно, смысла нет.. а жаль)
 
drserjДата: Вторник, 27.06.2017, 20:19 | Сообщение # 1583
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
Ну если расхождения минимальны

в том-то и дело... подозреваю, что сделано было исключительно для "уникальности книги"

как вариант - можно, в большинстве своем, сделать отбор подобных "шедевров", но овчинка выделки не стоит.
впрочем, как я уже сказал, легко сделать выборку и оценить надобность скачки либруса.


drSerj
 
jornadaДата: Вторник, 27.06.2017, 20:23 | Сообщение # 1584
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline

Цитата
как вариант - можно, в большинстве своем, сделать отбор подобных "шедевров", но овчинка выделки не стоит.
впрочем, как я уже сказал, легко сделать выборку и оценить надобность скачки либруса.
 
А можно скрипт на выборку? Посмотреть разницу. Если ради эксперимента.. можно конечно функцию написать, которая будет удалять из текста пробелы и переводы строки, а после этого считать хэш..  и посмотреть что получится в итоге
 
drserjДата: Вторник, 27.06.2017, 20:45 | Сообщение # 1585
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
А можно скрипт на выборку?
сейчас допилю плаг либруса, который опять "обновился" и набросаю...


drSerj
 
jornadaДата: Вторник, 27.06.2017, 20:48 | Сообщение # 1586
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
А еще можно попробовать реализовать алгоритм поиска нечетких дубликатов) я правда никогда с mysql не работал.. но могу все на ms sql утянуть)  подключить пару сборок и всю библу в файлстрим запихать)
 
drserjДата: Вторник, 27.06.2017, 20:53 | Сообщение # 1587
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
так, что-то типа 
SELECT bookid FROM flibusta.mlbook WHERE MD5 NOT IN (SELECT MD5 FROM librus.mlbook)

Ну, flibusta и librus - имена баз в программе, у тебя могут быть другие...
в этом запросе - выбираем все записи из флибусты, мд5 которых нет в либрусе
ну а если наоборот выбираем все записи из либруса, мд5 которых нет в флибусте
SELECT bookid FROM librus.mlbook WHERE MD5 NOT IN (SELECT MD5 FROM flibusta.mlbook)


drSerj
 
drserjДата: Вторник, 27.06.2017, 20:54 | Сообщение # 1588
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Репутация: 30
Статус: Offline
Цитата jornada ()
подключить пару сборок и всю библу в файлстрим запихать)

жесть, однако smile когда первую библиотеку делал - тоже аналогичное впихал, потом понял - горе smile


drSerj
 
jornadaДата: Вторник, 27.06.2017, 21:29 | Сообщение # 1589
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
Цитата
жесть, однако  когда первую библиотеку делал - тоже аналогичное впихал, потом понял - горе
  
Ну так это временно..  поиздеваться над содержимым. В родной среде оно как то привычнее. Потом можно обратно выгрузить, а можно и нет.. еще мобильное приложение написать и всем раздать) На самом деле это фантазии, никто оособо не заинтересован, посему вряд ли..
 
jornadaДата: Вторник, 27.06.2017, 21:34 | Сообщение # 1590
Рядовой
Группа: Пользователи
Сообщений: 15
Репутация: 0
Статус: Offline
Цитата
Кстати, как там вирус, до вас еще не докатился?

Какой такой вирус?
 
Поиск:

Copyright LibRusLib © 2024