Доступ к данным SPSS из Python, Java (groovy / grails) или C ++-приложения без лицензии для SPSS?

Я нахожу смешанные результаты поиска. Мне нужно проанализировать файл SPSS .sav, чтобы обнаружить макет данных и извлечь результаты опроса. Первый шаг – прочитать «схему» данных. Например, мне нужно знать вопрос и его тип разрешенных ответов. Я планирую моделировать эти данные в своей собственной таблице SQL, чтобы я мог нарезать и нарезать их в соответствии с требованиями моих приложений. Шаг второй заполняет мою модель данных ответами респондентов. Глядя на файл SPSS sav, я считаю, что у него есть оба типа данных, которые я ищу.

Мне не нужно или нужно дорогое программное обеспечение SPSS, если я его не требую строго. Мы не будем делать статистику по этим данным, просто выбрав подмножества респондентов на основе фильтров ответов. Файл SPSS будет предоставлен партнерской компанией, которая лицензирует SPSS. Мне не нужно возвращать данные в SPSS; мой вариант использования доступен только для чтения.

Я могу использовать Python, Java с Groovy или без Groovy, C / C ++ для моей программы парсера. Эта программа будет запускаться один раз в конце сбора данных, поэтому производительность не особенно важна. В идеале я хотел бы, чтобы мой код был кросс-платформой, поэтому я могу разрабатывать на своем Mac и развертываться в Linux, но я могу использовать окна, если нужно,

Многое из того, что я нахожу, это либо java-классы с 2004 года, либо современный код Python, для которого требуется DLL от IBM и зависит от Windows. Основываясь на моем кратком объяснении требований, я был бы признателен за рекомендации сообщества SO. Я думаю, что мои потребности просты, но я не нашел точно то, что я надеялся. Lib с открытым исходным кодом был бы идеальным, но я бы даже заплатил за простое коммерческое решение по разумной цене.

Вы можете бесплатно получить модули ввода / вывода SPSS с подробной документацией, чтобы создать собственное приложение для чтения (или записи) файлов sav. Модули доступны для всех платформ, поддерживаемых SPSS Statistics.

Перейдите на сайт сообщества SPSS по адресу http://www.ibm.com/developerworks/spssdevcentral и следуйте ссылкам для загрузки SPSS. Вы должны зарегистрироваться, но это бесплатно.

Файл SAV представляет собой двоичный формат с множеством сложных структур, поэтому лучше использовать модули ввода / вывода. И если новые функции добавляются в файл SAV, что часто случалось, модули ввода / вывода обновляются одновременно, поэтому ваш код не будет устаревшим.

HTH, Джон Пек

GNU PSPP может, по-видимому, читать файлы данных SPSS. Я также нашел ссылку на описание формата в источнике PSPP, хотя в нем есть предупреждение «не пытайтесь напрямую читать и записывать этот формат».

Здесь есть java-библиотека:

http://sourceforge.net/projects/spss-writer/