Обсуждение работы программы
| |
drserj | Дата: Воскресенье, 13.09.2015, 20:05 | Сообщение # 601 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Жаль, что упростили... Как говорил мой шеф - есть достаточное, а есть избыточное... Вот в общем случае - это избыточное...
Цитата PFN ( ) А если какой-нибудь дополнительный плагин?
Дополнительный... Не прокатит, либо в составе импорта, либо отдельная программа. Иначе - нонсенс с неадекватом... В принципе, нет ничего невозможного... В ближайшем времени - вряд ли, но кто знает...
drSerj
|
|
| |
PFN | Дата: Воскресенье, 13.09.2015, 20:48 | Сообщение # 602 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) Вот в общем случае - это избыточное... Возможно Вы и правы. Нельзя объять необъятное, а функционал усложнять - только вредить. Спасибо и за то, что уже есть и отлично работает.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
drserj | Дата: Воскресенье, 13.09.2015, 22:47 | Сообщение # 603 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Спасибо и за то, что уже есть и отлично работает. Всегда пожалуйста
drSerj
|
|
| |
1_абрам | Дата: Понедельник, 14.09.2015, 09:38 | Сообщение # 604 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата PFN ( ) Одно из "узких мест" всех подобных программ - это борьба с дубликатами.
Имхо, проблема надумана. Все электронные книжки должны быть на флибусте (появляется новая книжка размещайте ее на флибусту). На флибусте с дубликатами борются местные библиотекари. Что касается локальных библиотек (книги, которые нельзя разместить на флибусте), то они должны быть небольшими и там проблем с дубликатами нет.Добавлено (14.09.2015, 07:38) ---------------------------------------------
Цитата PFN ( ) Я перепробовал много разных каталогизаторов (от MyHome и кончая All My Books) и только с Вашей программой получил почти все, что хотел. +1, аналогичный опыт и оценка мультилиба.
|
|
| |
drserj | Дата: Понедельник, 14.09.2015, 10:42 | Сообщение # 605 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата 1_абрам ( ) Имхо, проблема надумана. Ну, не совсем надуманная, особенно для домашней коллекции, куда с кучи источников книги валят..
drSerj
|
|
| |
1_абрам | Дата: Понедельник, 14.09.2015, 11:20 | Сообщение # 606 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата drserj ( ) Ну, не совсем надуманная, особенно для домашней коллекции, куда с кучи источников книги валят..
А смысл домашней коллекции. Если книжка интересная - она обязана быть на флибусте. Таким образом на долю домашней коллекции остаются либо запрещенные книги, либо книги, представляющие интерес только для вас (отчеты, какие-нибудь и т.п.). В этом случае локальная библиотека небольшая и дублей немного.Добавлено (14.09.2015, 09:20) ---------------------------------------------
Цитата PFN ( ) а функционал усложнять - только вредить.
+1
Мультилиб отличает разумный аскетизм при огромных возможностях.
|
|
| |
drserj | Дата: Понедельник, 14.09.2015, 11:30 | Сообщение # 607 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата 1_абрам ( ) Если книжка интересная - она обязана быть на флибусте. щаззз.... я сетевую библиотеку (при нынешнем раскладе) воспринимаю ТОЛЬКО как источник, но не место хранения.
drSerj
|
|
| |
1_абрам | Дата: Понедельник, 14.09.2015, 14:16 | Сообщение # 608 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата drserj ( ) щаззз.... я сетевую библиотеку (при нынешнем раскладе) воспринимаю ТОЛЬКО как источник, но не место хранения.
1) Если ты имеешь в виду, что флибуста в любой момент может накрыться и поэтому ее нужно хранить всю целиком (в виде мд5.zip) , то я согласен.
2) А вот если у тебя есть книжки, которых нет на флибусте и ты их на ней не размещаешь, то это нехорошо, имхо.
Сообщение отредактировал 1_абрам - Понедельник, 14.09.2015, 14:17 |
|
| |
drserj | Дата: Понедельник, 14.09.2015, 20:09 | Сообщение # 609 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата 1_абрам ( ) флибуста в любой момент может накрыться не может, а именно накроется...
Цитата 1_абрам ( ) 2) А вот если у тебя есть книжки, которых нет на флибусте и ты их на ней не размещаешь, то это нехорошо, имхо.
чем же? Я никому ни чем не обязан... у меня много чего есть, всё отдать?
drSerj
|
|
| |
PFN | Дата: Понедельник, 14.09.2015, 21:20 | Сообщение # 610 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата 1_абрам ( ) Что касается локальных библиотек (книги, которые нельзя разместить на флибусте), то они должны быть небольшими и там проблем с дубликатами нет. У каждого свое видение "домашней" библиотеки. Мы уже неоднократно были свидетелями, когда свободные библиотеки в сети переходили на платный вариант. Могу привести еще массу аргументов, за то, чтобы все, представляющие для меня интерес, книги всегда находились под рукой.
Цитата 1_абрам ( ) Мультилиб отличает разумный аскетизм при огромных возможностях. Я это оценил! +100500
Цитата drserj ( ) я сетевую библиотеку (при нынешнем раскладе) воспринимаю ТОЛЬКО как источник, но не место хранения. Согласен, на 1000%. Доступ к ней может быть прекращен в любой момент и, по закону бутерброда, как раз тогда, когда какая-то книга может срочно понадобиться.
Цитата 1_абрам ( ) А вот если у тебя есть книжки, которых нет на флибусте Так туда и так заливают все кому не лень что попало и даже не самого лучшего качества. Я уже и со счета сбился, сколько книг пришлось переформатировать, чтобы можно было нормально их читать.
Цитата 1_абрам ( ) На флибусте с дубликатами борются местные библиотекари. Если в их архивах в одном тысячнике попадается как минимум 2-3 дубликата одной и той же книги, то я не слишком высоко оцениваю борьбу библиотекарей Флибусты с дублями. Предпочитаю бороться с этой напастью самостоятельно, выбирая наилучший вариант.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
Сообщение отредактировал PFN - Понедельник, 14.09.2015, 21:23 |
|
| |
drserj | Дата: Вторник, 15.09.2015, 08:29 | Сообщение # 611 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) Предпочитаю бороться с этой напастью самостоятельно, выбирая наилучший вариант. Это возможно только в случае, если библиотека крайне невелика, да и то, что бы оценить лучший вариант - необходимо обследовать все. Иначе, имеется вероятность обзавестись, например, более вычитанным, но не совсем полным экземпляром... Именно из-за того, что невозможно предугадать, какая копия лучше, приходится держать все экземпляры. Я не стал рассматривать библиотеку Траума именно из-за того, что он заявил, что отбирал лучшие экземпляры, хотя с учетом сотен тысяч книг это абсолютно нереально.
drSerj
|
|
| |
PFN | Дата: Вторник, 15.09.2015, 10:27 | Сообщение # 612 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата drserj ( ) Это возможно только в случае, если библиотека крайне невелика, да и то, что бы оценить лучший вариант - необходимо обследовать все. Иначе, имеется вероятность обзавестись, например, более вычитанным, но не совсем полным экземпляром... "крайне невелика..." А библиотеку в 200 - 250 тыс. книг Вы к какой категории относите?
Да, определенный риск получить не самый лучший экземпляр, конечно, имеется при любом размере библиотеки. Но и держать все экземпляры, забивая диск дубликатами - не рационально. Поэтому я для себя выстроил следующий алгоритм: 1. Приведение всех книг к единому формату имен: автор (фамилия имя)_серия-№_название 2. Выборка по Автору и Названию (с вариантами) 3. Приведение к единой кодировке (Win-1251) 4. Сравнение по Размеру и мд5 5. Из 100% совпавших удаляем лишние экземпляры 6. У несовпадающих проверка на наличие обложки и/или иллюстраций и их размеры (было бы замечательно, если бы формат FB2 жестко ограничивал их размер, например 350х525) 7. А тут уже вкусовой выбор экземпляра...
Можно, конечно еще смотреть в какой программе сделана книга. Если это Дизайнер, то обязательно будут проблемы. Убедился неоднократно. Наибольшая сложность с самыми популярными и плодовитыми авторами, особенно зарубежными. Разные переводчики по-разному пишут не только названия, но и фамилии и имена авторов (Герберт - Херберт и т.п.)
Кое-что из этого алгоритма я уже реализовал (переименование, выборка, кодировка), а остальное потихоньку довожу до ума.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
1_абрам | Дата: Вторник, 15.09.2015, 11:03 | Сообщение # 613 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Цитата drserj ( ) не может, а именно накроется...
Типун тебе на язык.Добавлено (15.09.2015, 08:43) ---------------------------------------------
Цитата drserj ( ) чем же? Я никому ни чем не обязан... у меня много чего есть, всё отдать?
Ты же скачиваешь книжки, поэтому должен помогать библиотеке. И это так естественно. Ты сделал книжку, затратил на это кучу усилий, как же не поделиться с товарищами, это так естественно.
Правда, ты своими программами столько сделал для библиотеки, что свободен от каких-либо обязательств.Добавлено (15.09.2015, 08:48) ---------------------------------------------
Цитата PFN ( ) Так туда и так заливают все кому не лень что попало и даже не самого лучшего качества. Я уже и со счета сбился, сколько книг пришлось переформатировать, чтобы можно было нормально их читать.
Так и надо заливать на флибусту улучшенную тобой книгу. Я, например, заметив больше 5 опечаток в книге заливаю исправленный вариант.Добавлено (15.09.2015, 08:54) ---------------------------------------------
Цитата PFN ( ) Согласен, на 1000%. Доступ к ней может быть прекращен в любой момент и, по закону бутерброда, как раз тогда, когда какая-то книга может срочно понадобиться.
Точно, поэтому разумно хранить полную фб2 сборку флибусты пополняя ее своими любимыми книжками (150Гб - это не очень много), не заботясь о дублях.Добавлено (15.09.2015, 09:00) ---------------------------------------------
Цитата PFN ( ) У каждого свое видение "домашней" библиотеки. Мы уже неоднократно были свидетелями, когда свободные библиотеки в сети переходили на платный вариант. Могу привести еще массу аргументов, за то, чтобы все, представляющие для меня интерес, книги всегда находились под рукой.
Согласен, у меня стратегия такая. Вся моя "домашняя" фб2-библиотека является подмножеством флибусты. И она всегда находится под рукой в виде локальной коллекции мд5.zip файлов. Имхо, это оптимальный вариант и для меня, и для сообщества флибусты.Добавлено (15.09.2015, 09:03) ---------------------------------------------
Цитата PFN ( ) Да, определенный риск получить не самый лучший экземпляр, конечно, имеется при любом размере библиотеки. Но и держать все экземпляры, забивая диск дубликатами - не рационально. Поэтому я для себя выстроил следующий алгоритм:1. Приведение всех книг к единому формату имен: автор (фамилия имя)_серия-№_название 2. Выборка по Автору и Названию (с вариантами)
Отличный алгоритм, хорошо бы тебе предложить его сообществу флибусты, чтобы всем миром обновить все архивы библиотеки, изменив id книжек на флибусте.
|
|
| |
drserj | Дата: Вторник, 15.09.2015, 11:21 | Сообщение # 614 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Цитата PFN ( ) А библиотеку в 200 - 250 тыс. книг Вы к какой категории относите? к достаточно большой
Цитата PFN ( ) Приведение всех книг к единому формату имен: автор (фамилия имя)_серия-№_название
для любой автоматизированной системы понятие имени отличается от понятия имени для человека. Оптимальным именем для автоматизированной системы является уникальный код, как правило хэш (тот же мд5).
Цитата PFN ( ) Выборка по Автору и Названию (с вариантами)
как автор, так и названия могут иметь существенные отличия. У автора могут быть различные варианты написания, псевдонимы, ошибки и т д. у книги - еще хуже, могут быть абсолютно разные названия.
Цитата PFN ( ) Приведение к единой кодировке (Win-1251)
вообще не приемлемо. единственной единой кодировкой может быть юникод, utf8 - содержащие в себе понятие кодовой страницы. Но это значительно (в разы) увеличит объем файла. Нужно ли это?
Цитата PFN ( ) Сравнение по Размеру и мд5 это да, у меня оно и работает.
Цитата 1_абрам ( ) Типун тебе на язык.
это, увы, суровая реальность, уже доводимая до действительности. Никто не хочет прислушиваться к моему совету - не держать все яйца в одной корзинке. И это погубит библиотеку. Только лишь дело времени. При нынешних условиях копирастии, необходимо четкое разделение - библиотека (пользователи, информация о книге, обсуждения) и контент, который никакими видимыми на основном сайте библиотеки средствами не может быть связан законом с этой самой библиотекой. Т.е. на сайте библиотеки не должно быть упоминаний и ссылок на контент. Абсолютно. Связь - хоть по мд5, хоть по ИД, но невидимая. Пока, как минимум, этого не будет - смерть библиотеки - дело времени.
Цитата 1_абрам ( ) Правда, ты своими программами столько сделал для библиотеки, что свободен от каких-либо обязательств.
вот-вот... впрочем, я на себя обязательств и не брал...
Цитата 1_абрам ( ) Я, например, заметив больше 5 опечаток в книге заливаю исправленный вариант.
и это есть зло... Плодится туева хуча ненужных дублей. Вот если бы ты взял и создал абсолютно корректный экземпляр, со всеми плюсами предыдущих и отсутствием минусов - да, только в этом случае можно заменить им все предыдущие. А так - очередная недоделка...
Цитата 1_абрам ( ) хорошо бы тебе предложить его сообществу флибусты, чтобы всем миром обновить все архивы библиотеки, Этого никогда не будет. Там где толпа - там только порождение хаоса. А обычным библиотекарям не под силу такое массовое действо. Просто изначально любая библиотека напирает на количество (что и понятно) вместо качества. И не важно, платная она или нет. Даже беря деньги за, якобы легальный, корректный контент, всё равно подсовывают тот же самопальный вариант. Впрочем, даже бумажные экземпляры содержат такое к-во ошибок, что страшно смотреть. Это не старые советские времена, когда за каждую опечатку несли ответственность... увы...
drSerj
|
|
| |
PFN | Дата: Вторник, 15.09.2015, 14:43 | Сообщение # 615 |
Генерал-майор
Группа: Друзья
Сообщений: 206
Статус: Offline
| Цитата 1_абрам ( ) Я, например, заметив больше 5 опечаток в книге заливаю исправленный вариант. И умножаем дубликаты... Я прошу прощения, т.к. не знаком досконально с механизмом заливки книг на Флибусту и сужу только по факту наличия в архивах-тысячниках множественных дублей одной и той же книги.
Цитата 1_абрам ( ) Точно, поэтому разумно хранить полную фб2 сборку флибусты пополняя ее своими любимыми книжками (150Гб - это не очень много), не заботясь о дублях. Именно это я и пытаюсь воплотить в жизнь.
Цитата 1_абрам ( ) в виде локальной коллекции мд5.zip файлов Вот с этим я не знаком. Можно где-нибудь просветиться на этот счет (описание, возможности и т.п.)?
Цитата 1_абрам ( ) хорошо бы тебе предложить его сообществу флибусты, чтобы всем миром обновить все архивы библиотеки, изменив id книжек на флибусте. Думаю, что для программистов Флибусты этот алгоритм давно знаком, а может даже и более эффективный. Вопрос стоит только в наличии энтузиастов, готовых его воплотить в реальный работающий продукт. Но я согласен с drserj, что Этого никогда не будет. Там где толпа - там только порождение хаоса. А обычным библиотекарям не под силу такое массовое действо.
Цитата drserj ( ) Оптимальным именем для автоматизированной системы является уникальный код, как правило хэш (тот же мд5). Это понятно. Просто, когда я еще не брался за создание программы, а пользовался разными программами поиска дубликатов типа DupKiller и т.п., то успел довольно много книг привести к этому формату имен. Пока будет так ибо этот процесс я уже автоматизировал почти на 100% Что касается мд5, то тут я откровенно слаб. Имею только общее представление. Не удивляйтесь ибо я - самоучка, а не профессиональный программист.
Цитата drserj ( ) Но это значительно (в разы) увеличит объем файла. Нужно ли это? Я это делаю для себя, получая сокращение объема почти на 40%
Цитата drserj ( ) Т.е. на сайте библиотеки не должно быть упоминаний и ссылок на контент. Абсолютно. Связь - хоть по мд5, хоть по ИД, но невидимая. Пока, как минимум, этого не будет - смерть библиотеки - дело времени. Истинно так!!!
Цитата drserj ( ) Впрочем, даже бумажные экземпляры содержат такое к-во ошибок, что страшно смотреть. Это не старые советские времена, когда за каждую опечатку несли ответственность... увы... Подписываюсь под каждым словом.
=============================== Приказ, который может быть понят неправильно, обязательно будет понят неправильно
|
|
| |
|