LibRusLib
Четверг, 20.06.2019, 21:22
Приветствую Вас Гость | RSS
 
Главная ФорумРегистрацияВход
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
Форум » Unilib » Проектирование и разработка » Обсуждение проекта (Обсуждение проекта)
Обсуждение проекта
drserjДата: Понедельник, 31.10.2016, 21:26 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Unilib - программа для создания локальных библиотек.

Unilib представляет собой развитый офлайновый каталогизатор локальной библиотеки с автоматизированной пакетной обработкой импортируемых книг. Программа позволяет производить автоматический отбор книг по критериям, заданным пользователем, отсеивать дубликаты и.т.д.

Особенности Unilib-а:

1) Поддержка нескольких библиотек.
2) Импорт/экспорт личных данных.
3) Возможность обмена данными с другими библиотеками Unilib.

Ориентировочная структура БД

Структура модуля импорта
 
PFNДата: Вторник, 27.11.2018, 23:15 | Сообщение # 361
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Приветствую! Судя по всему этот проект забыт и заброшен. weep  А может жизнь еще теплится в нем?

===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
drserjДата: Среда, 28.11.2018, 21:53 | Сообщение # 362
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Цитата PFN ()
Судя по всему этот проект забыт и заброшен.   А может жизнь еще теплится в нем?
Ну я бы не воспринимал всё так грустно... Скорее происходит процесс созревания smile Программист - как художник, пишет только когда накатывает вдохновение smile 
А вообще - тупо не хватает сил. На работе нет времени, да и дергают постоянно - не сосредоточишься. А дома - вечером пришел, поел, час на разгреб книг и прочей хрени, и спать... 
Надо тупо взять себя в руки и писать... Но это так тяжко smile


drSerj
 
PFNДата: Четверг, 29.11.2018, 00:22 | Сообщение # 363
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Цитата drserj ()
Программист - как художник, пишет только когда накатывает вдохновение

С этим не поспоришь. Сам такой... трудно вдохновляемый...  smile 
От всей души желаю вдохновения и творческих успехов!


===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
1_абрамДата: Четверг, 29.11.2018, 20:02 | Сообщение # 364
Генерал-полковник
Группа: Друзья
Сообщений: 1168
Репутация: 0
Статус: Offline
Цитата PFN ()
От всей души желаю вдохновения и творческих успехов!


+1
 
drserjДата: Четверг, 29.11.2018, 20:48 | Сообщение # 365
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Благодарствую. Еще бы и здоровья - вообще сказка...

drSerj
 
drserjДата: Суббота, 12.01.2019, 12:24 | Сообщение # 366
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
"Вот сидю и думаю..." (с) частушки, идеальный вариант перегонять в контент формата %z. Стоит ли делать возможность просто каталогизировать книги во всех форматах, тупо прописывая местоположение архива или книги и самой книги в архиве, или всё-таки принудительно гнать в %z. Казалось-бы, почему возник этот вопрос, дать народу все варианты и пусть сам думает что ему лучше? Ан нет, все хотят управление самими файлами (удаление, переносы и прочее), а это с многофайловыми архивами никак не вяжется. Одно дело удалить файл, другое - файл из многотысячного архива объемом гиг 5...  Как программист, понимающий, что при количестве книг больше тысячи найти книги по имени файла весьма затруднительно и теряется смысл в "очеловеченном" имени файла - я за первый вариант. Но как пользователь, боящийся потерять хоть какой-то вариант найти нужную книгу без программы - даже не знаю... Естественно, при втором варианте теряется львиная доля сервисов и скорость обработки. Хотя, думается, любителям "человеческих" имен можно подыскать и другие каталогизаторы. Или я не прав?

drSerj
 
PFNДата: Воскресенье, 13.01.2019, 02:25 | Сообщение # 367
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Цитата drserj ()
Как программист, понимающий, что при количестве книг больше тысячи найти книги по имени файла весьма затруднительно и теряется смысл в "очеловеченном" имени файла - я за первый вариант. Но как пользователь, боящийся потерять хоть какой-то вариант найти нужную книгу без программы - даже не знаю...

Во первых строках письма - С Новым годом и наилучшими пожеланиями!  smile 

Теперь по сути вопроса:
1. Я любитель "человеческих" имен файлов, но только на стадии предварительной обработки, чтобы вычистить дубликаты.
2. Поиск нужной книги без программы - это муторно и не нужно. Особенно если библиотека не разбита на директории типа: "F:\Книги\А\АБРАМОВ Александр\Апробация.fb2", а загнана в архивы.
3. В крайнем случае можно задать поиск с контекстом. В Тотал Командере такой имеется и работает неплохо.

Цитата drserj ()
все хотят управление самими файлами (удаление, переносы и прочее), а это с многофайловыми архивами никак не вяжется. Одно дело удалить файл, другое - файл из многотысячного архива объемом гиг 5...

Канечно хатим! smile  Но все эти "удаления" и пр. нужны на стадии предварительного отбора, а потом уже можно и в архивы и в любой формат...
А дальше (если кому приспичит) то пусть сам тащит из архива что ему там мешает и вставляет то, что ему нужно...  smile


===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
drserjДата: Воскресенье, 13.01.2019, 17:57 | Сообщение # 368
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Цитата PFN ()
Во первых строках письма - С Новым годом и наилучшими пожеланиями!
 Ну да, ну да... Скорее со старым НГ... 

Теперь по сути, как раньше любили писать: "многабукофф, ниасилил". Осилить, конечно, осилил, но ответа не получил smile Вроде, и то хотим, и против того - не против smile Дык шашечки, или ехать? Материал в каком формате храним?


drSerj
 
PFNДата: Понедельник, 14.01.2019, 14:00 | Сообщение # 369
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Цитата drserj ()
Дык шашечки, или ехать? Материал в каком формате храним?

Формат хранения оставить на выбор пользователя. Хочет %z - жмакает кнопочку или ставит "галочку" в Чекбоксе... Не хочет - пусть сам мучится... Вот так будут и "шашечки" и транспорт, чтобы ехать...  smile


===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
drserjДата: Понедельник, 14.01.2019, 21:34 | Сообщение # 370
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Цитата PFN ()
Формат хранения оставить на выбор пользователя.
Угу... И опять плодить монстра... Проходили...


drSerj
 
drserjДата: Четверг, 17.01.2019, 15:14 | Сообщение # 371
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
В общем, как оно пока работает:
Выбираем каталог в котором имеются файлы с книгами. На сегодня поддерживаются кроме zip еще и rar, в том числе и многокнижные архивы. Тут, конечно, имеется проблема с определением - это одна книга из нескольких файлов, или несколько книг. Но, поскольку, любые файлы кроме фб2 валятся в отсев с признаком "Требуется описание книги" - можно сделать пункт в меню "Воспринимать как один файл" и проблема, думается, исчезнет. Так вот, встретив фб2 или фбд программа анализирует их на предмет автора, серии, жанра, и т д, создает, если отсутствуют авторов, серии жанры, добавляет всё это в базу, включая аннотацию и обложку (можно будет отключить). Естественно в отсев падают мд5-клоны, битые архивы, книги без описания или с недостаточным описанием (нет заголовка и т д), ошибки разбора (некорректный фб2). Т.е. в базу попадают валидные фб2 и книги, имеющие фбд-файл, остальное - в таблицу отсева. 
И вот тут, на этапе добавления в основную базу хотелось бы что-то с файлом делать, ибо тут теряется полный путь к файлу, хранить который в основной базе бессмысленно. А тогда, при наличии в разных каталогах одноименных файлов начнется разброд и шатание. При использовании формата %Z - проблемы нет, одинаковых файлов быть не может, расположение заранее известно, поиск не требуется от слова совсем. Делать имя книги по букид при наличии мд5 - смысла нет никакого. При "вменяемых" именах файлов приключения гарантированы smile 
Итак, что имеем:
- сделан основной блок импорта (не до конца, но уже работает)
- сделаны основные закладки Автор Серия Жанр (в большинстве своем работает)
Что надо как минимум:
- редактор информации о книгах, авторах, сериях, жанрах и т д
- экспорт, копирование на устройство, в общем, весь функционал работы с файлами и записями БД
- поиски
... короче, начать и кончить smile

Имеется предложение файлы, корректно добавленные в базу, всё-таки перегонять в формат %z по месту положения основного (указанного) каталога с контентом.
В идеале, при использовании пользовательской схемы - перегонять в разные каталоги (например, фб2 - в один, пдф и иже с ним - в другой ну или как-то так, в зависимости от условий)


drSerj
 
PFNДата: Четверг, 17.01.2019, 19:57 | Сообщение # 372
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Цитата drserj ()
При использовании формата %Z - проблемы нет, одинаковых файлов быть не может,


Как я понимаю в основе %z лежит код МД5. Конечно одинаковых файлов не будет, а дубли будут прекрасно жить и поживать, т.к. всего один единственный лишний или недостающий пробел изменит код МД5.
Здесь нужен фильтр, а потом можно и в %z...  smile 

Цитата drserj ()
В идеале, при использовании пользовательской схемы - перегонять в разные каталоги (например, фб2 - в один, пдф и иже с ним - в другой


Мысль интересная и заслуживает внимания. Да и сделать распределение по расширению файла особой трудности, на мой взгляд, не представляет...
Я сейчас многоавторские сборники гружу в специальные папки по жанрам: детективы, фантастика и т.п.. чтобы не путались в папках отдельных авторов.
В идеале от сборников стоило бы избавиться совсем, т.к. их составители суют в них все что ни попадя и в них дублируются многие произведения, находящиеся в отдельных файлах.


===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
drserjДата: Четверг, 17.01.2019, 20:51 | Сообщение # 373
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Цитата PFN ()
а дубли будут прекрасно жить и поживать, т.к. всего один единственный лишний или недостающий пробел изменит код МД5.

Я думаю, от того что мы это напишем сто раз - ничего не изменится. Уже давно договорились, дубли кроме МД5 - ручками. Нельзя это переложить на плечи компа. Даже если и будет дубль - какая версия правильнее - нельзя определить. Даже человеку, не сравнив два документа, невозможно это решить. Нет, если есть алгоритм "лучшести" - велком, будем пытаться реализовывать. А нет - дык ручками... Но в основную базу, по идее, попадут все экземпляры, ибо там - в названии буква или знак не тот, там автор другой, там еще какие различия. Теоретически - можно написать фильтр, практически... Не хотел бы я таким фильтром кавырнадцать тысяч файлов просканить. А потом еще и анализировать...

Цитата PFN ()
Мысль интересная и заслуживает внимания


Значит будем думать...


drSerj
 
PFNДата: Пятница, 18.01.2019, 12:27 | Сообщение # 374
Генерал-майор
Группа: Друзья
Сообщений: 189
Репутация: 0
Статус: Offline
Цитата drserj ()
Уже давно договорились, дубли кроме МД5 - ручками. Нельзя это переложить на плечи компа.


Кое-что все-таки можно...  smile  Этим я и занимаюсь вот уже больше года. Кое-что получается, но, в основном, конечно - ручками. Комп сразу открывает директорию автора и находит файл с тем-же названием, показывает обложку, размер и т.д... А дальше только ручки... Сравниваем, худший удаляем, лучший "заносим в дом"...   smile 

Цитата drserj ()
Нет, если есть алгоритм "лучшести" - велком, будем пытаться реализовывать. А нет - дык ручками...


Кажется, у вас был подобный алгоритм, который на стадии отбора выводил сравнительную табличку файла в библиотеке и в директории отбора. Но я с трудом представляю себе, как это сделать если файлы в библиотеке содержатся в архивах... Это точно: "И опять плодить монстра... Проходили..." В таком случае овчинка не стоит выделки.

Цитата drserj ()
Теоретически - можно написать фильтр, практически... Не хотел бы я таким фильтром кавырнадцать тысяч файлов просканить. А потом еще и анализировать...


Теоретически... Можно многое придумать, а реализовать - проблема... Я с фильтром по языкам (перемещает сразу книги на иностранных языках в отдельную папку) почти месяц возился. Вроде все отладил, а нет-нет и случаются сбои... Так что "ручки пользователя" - самый лучший фильтр...  smile


===============================
Приказ, который может быть понят неправильно, обязательно будет понят неправильно
 
drserjДата: Суббота, 19.01.2019, 19:35 | Сообщение # 375
Генералиссимус
Группа: Администраторы
Сообщений: 4477
Репутация: 28
Статус: Offline
Цитата PFN ()
Теоретически... Можно многое придумать, а реализовать - проблема...

Реализовать - одно, пользовать - с такой скоростью лучше не надо smile

Цитата PFN ()
был подобный алгоритм, который на стадии отбора выводил сравнительную табличку файла в библиотеке и в директории отбора

Надеяться на правдивость информации в фб2 (в частности версия, дата, и т д) абсолютно не имеет смысла. Тем более, что качество книги от версии файла никак не зависит, а сволочей, портящих книги, вполне достаточно. По этому и убрал этот фильтр.


drSerj
 
Форум » Unilib » Проектирование и разработка » Обсуждение проекта (Обсуждение проекта)
Поиск:

Copyright LibRusLib © 2019