Пожелания
| |
1_абрам | Дата: Суббота, 23.01.2010, 12:41 | Сообщение # 31 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Quote (drserj) А описание автора - оно вообще только на флибусте выкладывается. Если я его сделаю - на либрус материться будет... Да и ,опять-таки, ну оно надо реально??? Ну, сколько человек будет это читать??? В принципе согласен, я вот добавил описание автора на флибусту и сразу же захотелось, чтобы мой труд не пропал и сохранился в локальной библиотеке - так что у меня получается шкурный интерес. А если серьезно, то конечно наличие аннотаций, рецензий, обложек и.т.п. украшает программу, но не является принципиальным. Реализовать все это не просто, и посколько ты делаешь программу один, все это лучше отлажить на потом.
|
|
| |
drserj | Дата: Суббота, 23.01.2010, 13:30 | Сообщение # 32 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Quote (1_абрам) Реализовать все это не просто Вот это реализовать как-раз и не сложно, проблема в скорости. В моей локальной программе, которую я писал изначально, не опираясь на базы либруса это и было реализовано. Но, картинки и описание хранятся в базе, что резко повышает скорость. Однако, расчитана она явно не на такие объемы. Если я всё это засуну в базу - объемы ее будут очень и очень не маленькие, скорость обработки тоже может упасть. Посчитаем: на обложку+аннотацию в среднем 20-25 кил, умножим ну на 200 тыщ, итого - почти 5 гиг... стоит оно того?
drSerj
|
|
| |
drserj | Дата: Суббота, 23.01.2010, 13:41 | Сообщение # 33 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Quote (Vultures) Ну для локальной коллекции задержка должна быть небольшой. Это так кажется, я проверял, даже 1 секунда обработки уже вызывает явный дискомфорт. А тут - может быть куда больше. А если коллекция, как у меня, лежит на другой машине и доступ к ней по сети? А если размер файла под 3 метра? А если упакован 7z ? Каждое условие замедляет обработку на порядок. Quote (Vultures) Лишнее действие (жмык клавиши Enter) вызывает некоторую фрустрацию. а я на пробел повесил - куда удобнее, на ентер я повесил открытие.
drSerj
|
|
| |
drserj | Дата: Суббота, 23.01.2010, 13:42 | Сообщение # 34 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| В общем так, в этой версии обложка и аннотация в автомате не будет. Если получится нормальная скорость - добавлю.
drSerj
|
|
| |
1_абрам | Дата: Суббота, 23.01.2010, 13:46 | Сообщение # 35 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| А если не загружать автоматически картинки и описание, а делать это для каждого автора отдельно, специальной командой захотел посмотреть - нажал "Загрузить описания" и в базу добавила соответствующая информация для выбранного автора. У каждого свои любимые авторы ~ 100. Умнажаем: 100*25K= всего 2.5Мб.
|
|
| |
drserj | Дата: Суббота, 23.01.2010, 15:44 | Сообщение # 36 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Quote (1_абрам) У каждого свои любимые авторы ~ 100. Умнажаем: 100*25K= всего 2.5Мб. Да не с авторами проблемы, вопрос стоял о обложках и аннотациях. А по поводу авторов - дык либрусек не дает такую информацию. Ее дает только флибуста.
drSerj
|
|
| |
1_абрам | Дата: Четверг, 28.01.2010, 12:46 | Сообщение # 37 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Quote (drserj) Да не с авторами проблемы, вопрос стоял о обложках и аннотациях. А по поводу авторов - дык либрусек не дает такую информацию. Ее дает только флибуста. Так я и писал про обложки и анотации. Суть моего предложениия загружать в базу не все обложки и аннотации: "Посчитаем: на обложку+аннотацию в среднем 20-25 кил, умножим ну на 200 тыщ, итого - почти 5 гиг...", а только часть их "100*25K= всего 2.5Мб." (см. сообщение выше) , что обеспечит скорость работы программы.
|
|
| |
drserj | Дата: Четверг, 28.01.2010, 13:40 | Сообщение # 38 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| вопрос, какую именно часть, и по каким критериям....
drSerj
|
|
| |
1_абрам | Дата: Четверг, 28.01.2010, 14:28 | Сообщение # 39 |
Генералиссимус
Группа: Друзья
Сообщений: 1207
Статус: Offline
| Quote (drserj) вопрос, какую именно часть, и по каким критериям Так я именно об этом и писал выше: "А если не загружать автоматически картинки и описание, а делать это для каждого автора отдельно, специальной командой захотел посмотреть - нажал "Загрузить описания" и в базу добавила соответствующая информация для выбранного автора". Т.е. по умолчанию картинок и описаний в базе нет. Если пользователь хочет, чтобы они появились он должен выбрать автора, нажать кнопку "Загрузить описания". По этой команде в базу добавиляются обложки и аннотации выбранного автора. Если пользователь сделает это 200 тыщ раз - то получить на свою щею проблемы со скоростью. Кстати, мне обложки и аннотации на фиг не нужны.
|
|
| |
drserj | Дата: Четверг, 28.01.2010, 14:35 | Сообщение # 40 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Ой. не нравится мне это... Для локальной программы на небольшое к-во книг - допустимо, а на такое... как-то не катит...
drSerj
|
|
| |
flegmas7797 | Дата: Пятница, 29.01.2010, 12:32 | Сообщение # 41 |
Рядовой
Группа: Пользователи
Сообщений: 1
Статус: Offline
| Можно и я нажелаю? Очень понравилось, как сделана программа. Своё назначение она выполняет на все сто, очень жаль, что я о ней узнал совсем недавно. Конечно, это не Библиотекарь, и даже не Каталогизатор, это прекрасный Сканер онлайновой библиотеки с дополнительными сервисными функциями – поиск, закачка и т.д. А вот под Библиотекарем я понимаю программу для хранения-управления локальной коллекцией е-книг. И здесь идеала мной пока не найдено, Наиболее близкое приближение – Fb2Librian. А сейчас о том, чего хочется. Надеюсь, это будет в тему данного топика. Я, собственно, коллекционер-любитель, или любитель-коллекционер, т.е. собирать все имеющиеся в мире тексты мне не интересно. Зато есть авторы, которых я читаю, или собираюсь читать, или возможно когда-нибудь соберусь читать. Вот у этих авторов хочется иметь в локальном варианте все имеющиеся русскоязычные тексты и всякую дополнительную информацию. Таких авторов наберётся несколько сотен, может тысяча, но круг их постоянно растёт. Плюс околонаучная литература интересующей тематики: история, мифология, разная натуралистика и т.д. Вот, исходя из этого (не запредельный набор книг, всё может отслеживаться и правиться вручную), у меня желания и формируются. Программу, на мой взгляд, можно поделить на три части: - управление локальной коллекцией; - добавление книг в локальную коллекцию; - сканер онлайновых библиотек. Для локальной коллекции хочется. 1. Формат книжек fb2. Для остальных форматов файл описания (*.fbd) запакованный с книжкой в один архив. 2. Хранение – файловая система. Структура папок и названия файлов – настраиваемые, с необязательными частями (например: отчество, серия, номер в серии - если они есть). 3. Все поля из заголовка fb2 должны быть в базе и редактироваться там и там одновременно. 4. Авторы. Нужна поддержка синонимов для разных написаний, транскрипций и т.д. Поддержка псевдонимов – псевдонимы показываются в списке авторов и подставляются в заголовки книжек, как авторы. Для списка книг у одного автора нужен выбор (флажок) – показать книги, опубликованные только под этим именем, или под всеми псевдонимами. Соавторов можно обрабатывать как коллективный псевдоним. У псевдонимов тоже могут быть синонимы. 5. Авторы. Хранить в базе фотографию, биографию и библиографию (в текстовом виде). 6. Добавить закладки для переводчиков и, желательно, ключевых слов. 7. Весьма желательно, кроме тематических жанров, хранить форму произведения: драматургия, поэзия, беллетристика, остальное. Возможно, двухуровневую - для выделения романов, сонетов, трагедий, очерков, писем, эссе и т.д. Для форм произведений тоже можно отдельную закладку. В списке книг нужен фильтр по первому и второму уровню формы и фильтр на крупную, мелкую форму – можно настраиваемый. 8. Пользовательские группы – вполне устраивает сегодняшняя реализация. 9. Список книг. Скрываемые колонки на все поля из заголовка fb2, ну, или почти все, обязательно колонка для переводчика и подсериала, плюс форма произведения, плюс признаки вхождения в группы. Под списком – настраиваемая форма – сам выбираю, какую информацию о книге выводить туда дополнительно. 10. Кроме основного поиска – расширенный, по всем полям базы (не очень важно, но иногда полезно). 11. Групповые операции заполнения полей. Чтобы для выделенных книг можно было одной операцией менять значение некоторого поля(ей): серия, жанр, автор, дата написания и т.д. Добавлено (29.01.2010, 11:32) --------------------------------------------- Часть 2 Для добавления книг и онлайн сканера с требованиями проще. Уже есть реализации близкие к идеальным. Добавление новых книг очень хорошо реализовано в Fb2Librian: - выбор каталога для загрузки, - три этапа - сканирование каталога, обработка добавляемых книг, загрузка в базу согласно статуса после обработки, - множество статусов обработки (разные виды дублей и ошибок), - возможность сразу отредактировать информацию в добавляемой книге и обработать заново, - выбор операции для дубликатов (добавить к существующим, заменить дубль, редактировать описание и повторить обработку, удалить из списка загрузки) для отдельных книг и для списка, - сохранение списка обработанных, но не загруженных в базу книг, для ручной доработки завтра, - открытие добавляемой и имеющейся в базе книги для сравнения текста, - бэкап заменяемых книг, - сохранение файла книги по шаблону пути и имени. Хочется добавить только одно: облегченный режим первоначального заполнения, в котором программа будет тупо запихивать в базу всё, что смогла признать книгой, и раскладывать файлы. Что в базу не запихано – не удаляется. Для сканирования онлайн библиотеки LibRusLib лучший. Осталось добавить поддержку многих онлайн библиотек, каждую со своими сохраняющимися настройками доступа, и загрузку книг сразу в локальную базу (ну, или в подпрограмму добавления книг). Ну и конечно, поиск похожих книг в локальной коллекции. Вот такие вот глобальные мечты. Теперь можно их подравнять. Серпом.
|
|
| |
drserj | Дата: Пятница, 29.01.2010, 14:55 | Сообщение # 42 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| серпом... это хорошая мысль... лучше бомбой... атомной... что б наверняка По поводу пожеланий - если внимательно почитать топик - то можно узнать, что планируется мультибиблиотечная версия с возможностью добавления своих книг и т. д. Правда, в связи с постоянными пожеланиями к предыдущей версии (точнее ветке), времени на разработку новой - практически не остается. Постоянно приходится рассматривать и добавлять различные хотелки, доработки и т.д. (в большинстве своём - мало кому нужные). По поводу хотелок как в Fb2Librian - у меня давно уже работает моя программа, аналогичная Fb2Librian, но с теми изменениями, которые мне не понравились в Fb2Librian. Я и хочу объединить эти два проекта в один. Есть много вопросов, проблем. Пока не решу - естественно, мультибиблиотечной версии не будет. Единственное, что хотелось бы напомнить - чем больше данных мы будем хранить и обрабатывать, тем больше места будет занимать база, тем ниже будет скорость обработки, тем сложнее будет работать с программой. Самое сложное - это определить где избыточность, а где - достаточность и выбрать оптимальный вариант. Всегда найдутся недовольные, которые захотят чего-нибудь еще. Посему, предпочитаю всё сначала хорошо продумать и взвесить, прежде чем писать. Иначе прийдется переписывать сотню раз.
drSerj
|
|
| |
Vultures | Дата: Пятница, 29.01.2010, 20:38 | Сообщение # 43 |
Рядовой
Группа: Пользователи
Сообщений: 9
Статус: Offline
| drserj Я немного отвлекся от ветки — аврал. Проблема ясна, но имеет место только для обложки, без которой вполне можно прожить. Другое дело аннотация. Аннотация без обложки не должна привести к чрезмерной задержке и распуханию БД. М?
|
|
| |
drserj | Дата: Пятница, 29.01.2010, 23:11 | Сообщение # 44 |
Генералиссимус
Группа: Администраторы
Сообщений: 4693
Статус: Offline
| Можем посчитать, в общем-то... размер аннотации умножить хотя-бы на 200 000. т.е При условии аннотации в 1кб - это 200 метров. Сама база с индексами - около 80 метров. Итого - одни описания - уже почти в 3 раза превышают общий объем базы. Ладно, неприятно, но не смертельно. Второй, и более важный вопрос.... Господа, а где вы собираетесь брать эти самые описания? Их на сайтах нет, они вытягиваются непосредственно из файлов книг. А теперь, следующий вопрос: вы хоть немножко представляете время, которое понадобится для вытягивания этих самых описаний из файлов??? На одно описание при хорошей машине от 1 до 15 секунд. Считаем, в среднем - 5. Итак, 5 секунд*200000 / 60 - 16667 минут - 277 часов - 12 суток непрерывной работы. И это - как минимум... Ладно, разово - терпимо (хотя, найти такого экстримала - это уже проблема). Но, при том к-ве поступлений, которое сейчас (в среднем 150 книг ежедневно) это 13 минут (на хорошей машине). И это при условии, что выполняться процедура будет ежедневно! А если 2 дня? А месяц? Да, можно выгребать описания кусками (жуть как "удобно"), но, возникает вопрос - а какие именно книги будем потрошить? Интересные? Дык для этого надо читать описание Круг замкнулся, однако. Ежели я не прав - поправьте, буду весьма рад. P.S. Как уже писалось ранее, я написал программу для своей локальной библиотеки, в которой используется подобная система. Так вот, добавлять книги - тоскливо. Десятки - нормально, сотни - ну, можно терпеть... ну а тысячи - у меня героизма не хватило Боле того, с увеличением размера базы скорость падает за счет создания индексов... Я это даже не учитывал в предыдущем разгребе !!!!
drSerj
|
|
| |
flegmas | Дата: Суббота, 30.01.2010, 00:29 | Сообщение # 45 |
Рядовой
Группа: Пользователи
Сообщений: 2
Статус: Offline
| На мой взгляд, хотелки к текущей версии не очень серьёзны. Ничего существенного, кроме желания мультибиблиотечности. Через месяц-два всё стихнет. Я, собственно, и упор делал на локальную версию и на тот функционал, который пока нигде не реализован. А когда он повится и где, всё в руках энтузиастов-разработчиков. Удачи вам!
|
|
| |
|