Home
Моя знакомая попросила помочь ей. Завтра сдавать отчет, а результаты не готовы! Вот как она описала проблему:

На основе данных полученных в результате опроса, средствами программы SPSS, необходимо составить портрет потребителя.
Опрос состоял из 16-ти вопросов, на которые предлагалось выбрать тот или иной вариант ответа.
Вопросы примерно следующего содержания:

1.Ваш пол
1.М 2.Ж

2. Возраст
1.20-30 2. 31-40 3. 41-50

3.Гражданство
1.РФ 2.СНГ 3.Другое

На выходе (после анализа в SPSS) результаты должны быть следующими: наиболее типичным потребителем является - мужчина в возрасте от 31 до 40 лет, гражданин РФ и т.д…

Попыталась использовать факторный и кластерный анализ, но результаты группируются по вопросам, а не по вариантам ответов.

Что делать? Какой метод использовать?

boxplot в SPSS 17.0

  • 12 Июл, 2009 at 1:20 AM
установил последнюю версию. но теперь по - человечески как сделать Boxplot не разберусь. То,что через меню  charts> interactive глючит явно, рисует просто линии с точками, ничего не нумерует ......  печально одним словом. приходится привыкать к новью..

помню, что через  regression работала коробочная диаграмма, но кто - нибудь знает как её задать там? 


Господа,

Спасибо всем еще раз за помощь. Я хотела обратиться с вопросом по поводу иерархического кластерного анализа. Попытка провести такой анализ выдает "Недостаточно памяти для кластера". У меня примерно 48000 строчек, и я для пробы ввожу всего одну интервальную переменную. Если в методе я помечаю "стандартизовать", то получаю в ответ :"Ошибка 63. Не находится файл spssclus.tmp" Что за файл, откуда взялся? 

Update: Поняла, поняла! Больше так не буду! К-means работает прекрасно. Я, просто, переживала, что выбор k  получается вроде как произвольным. Но я учту про использование нескольких меньших выборок. Спасибо всем.

Neural Network: Multilayer Perception

  • 2 Июл, 2009 at 5:04 PM

Господа, такой вопрос по Multilayer Perception.

Когда я запускаю Multilayer Perception с n-ным количеством независимых переменных (covariates) то на выходе получаю всегда модель ровно с этим количеством переменных. Я когда-то работала с Weka. Так она выдавала конечную модель только из "нужных" переменных - сама выбирала, какие "важные", а какие нет. (Пример то же, что делает Stepwise метод в линейной регрессии.) В SPSS нет такой опции, или я не могу ее найти? Я нашла опцию "Independent variable importance ". Тогда выдается таблица, где напротив каждой переменной значение ее "важности" от 0 до 100%. Но это не полноценная замена. Кроме того я не вижу, какой процент ошибки в тест и в training по отдельности. Подскажите, пожалуйста.

Небольшой вопрос по факторному анализу..
Есть фактор А - главный фактор. Есть факторы Б, В, Г.
Можно ли сказать, что факторы Б,В,Г детерминируют фактор А? Если нет, то какой статистический метод можно применить для проверки гипотезы о влиянии факторов Б,В,Г на фактор А?
З.Ы. Сложившиеся факторы как по ортогональному, так и не по ортогональному решению сходны..
Коллеги, у меня такой вопрос.
По совету [info]alexwin1961 установил демо-версию последнего SPSS ради его русскоязычной справки. Теперь хотелось бы SPSS снести, а файлы справки, туториалов и т.д. оставить.
Возможно ли такое? И если да, то как это сделать?
Спрашиваю потому, что в директории SPSS отдельной папки под это дело не обнаружил.
Заранее благодарю.

Очень медленный OMS

  • 22 Июн, 2009 at 11:04 AM
Посоветуйте, пожалуйста. Я использую OMS для подсчета и записи в файл коэффициентов curve estimation. В изначальной базе данных у меня 170,000+ строк, 32,000 пользователей. Curve Estimation считается для каждого пользователя отдельно.  Занимает это кучу времени. Даже на 8,000 пользователях и только Linear - до 15 минут. При этом использование команды Save в Linear Regression дает результат почти мгновенно.

1) Как можно (если можно) ускорить работу OMS? 
2) Есть ли способ записать в файл коэффициенты регрессии или кривой с помощью SAVE,  а не ОМS? 

Мой код на всякий случай.

SORT CASES BY UserID.
SPLIT FILE LAYERED BY UserID.

OMS /DESTINATION VIEWER=NO /TAG='suppressall'.

DATASET DECLARE regressioncoeff.

OMS /SELECT TABLES
/IF COMMANDS=['curvefit'] SUBTYPES=['Model Summary and Parameter Estimates']
/DESTINATION FORMAT=SAV numbered = "TN" OUTFILE='regressioncoeff'
/columns sequence = [l1 r2].

TSET NEWVAR=NONE.
CURVEFIT
/VARIABLES=target WITH Count
/CONSTANT
/MODEL=LINEAR LOGARITHMIC QUADRATIC.

OMSEND.

Информация о компьютере:

Процессор: Intel(R) 2.ooGhz
Скорость процессора: 1.95Ghz
RAM 2048MB
Microsoft Windows XP Professional

Спасибо заранее

факторный анализ

  • 13 Июн, 2009 at 6:28 PM
Выхожу на очередной этап разработки опросника диагностики одиночества Lost. (похвастаюсь - на международной конференции МНСК 2009 взял первое место =) )

Итак, из опросника в 73 вопроса сложилось 8 факторов, которые можно условно разграничить по 3 категориям - факторы коммуникативного, когнитивного и эмоционального блока (именно такая структура закладывалась в типологии). Естественно, если некоторые факторы получились очень "комфортными" (с хорошими нагрузками, полные), то те, которым дисперсии "не осталось" *улыбка*, отвоевали себе не 10 вопросов, как закладывалось в опробационной модели, а по 3-5 вопросов. (Вообще, уважаемый мною товарищ Куликов на Питерской конференции говорил, что в факторной структуре следует учитывать только первые 2-3 фактора, и что Кеттелл - странный товарищ *улыбка*).

В связи с этим.. Можно ли продолжать разработку опросника по блокам, беря 2-3 фактора, сложившиеся в предварительном исследовании? Хочу сейчас взять когнитивный блок, расширить количество пунктов в "шкалах" до 20, провести повторную факторизацию. При подтверждении факторной структуры, валидизировать и верифицировать отдельно когнитивный блок методики?
Друзья! Подскажите пожалуйста, что мне надо сделать чтобы с помощью SPSS Statistics 17.0 открыть файл с расширением .spo (это аутпут с кросстабами). Он, по всей видимости, создавался в какой-то другой версии SPSS, но выяснить в какой именно уже не представляется возможным. Если не 17ой версией, то какой же его можно открыть? Дело в том, что я могу найти версию только не позднее 13ой.
Спасибо.

Корреляционные плеяды

  • 6 Июн, 2009 at 3:45 PM
Вопрос не совсем про SPSS. Часто ли в работах вам приходится строить корреляционные плеяды? Какие вы видите "за" и "против" этого способа отображения связей.
Есть ли какой-то софт, для автоматического построения оных?
прошу прощения за офтоп, но с каждым сожет случиться :(

Уважаемые коллеги !

Просим Вас отреагировать на событие, произошедшее с нашим коллегой из Тюмени, кандидатом социологических наук, Грошевым Игорем Львовичем.
В ходе своего исследования, Игорь Львович провел опрос курсантов Тюменского юридического Института МВД. По результатам опроса им была написана статья, не понравившаяся начальнику Института, поскольку курсанты в своих ответах писали о взятках и других нарушениях, с которыми они сталкивались во время обучения. В итоге, администрация обвинила социолога в нанесении ущерба деловой репутации Института, а суд, в свою очередь , признал иск справедливым.
На сайте Российского Общества Социологов размещено открытое письмо президента РОС Валерия Андреевича Мансурова по делу И. Л. Грошева. http://www.ssa-rss.ru/index.php?page_id=59
Уже поступают первые отклики. В приложении Вы найдете отклик д.ю.н., профессора Гилинского Я. И.
Очень ждем Вашего ответа.

С уважением, секретариат РОС

прошу пеарить = помогает
все книжки на сайте dbebooks.biz, чтоб скачать, нужно зарегистрироваться на нем

 Confirmatory Factor Analysis (Pocket Guides to Social Work Research Methods) http://www.dbebooks.biz/ebooks/nonfiction/10333-confirmatory-factor-analysis-pocket.html

Power Analysis for Experimental Research: A Practical Guide for the Biological, Medical and Social Sciences http://www.dbebooks.biz/2007/08/09/power_analysis_for_experimental_research_a_practical_guide_for_the_biological_medical_and_social_sciences.html


Regression Methods in Biostatistics: Linear, Logistic, Survival, and Repeated Measures Models
http://www.dbebooks.biz/ebooks/medicine/10385-regression-methods-in-biostatistics.html


 Biostatistics for Radiologists: Planning, Performing, and Writing a Radiologic Study http://www.dbebooks.biz/ebooks/medicine/10340-biostatistics-for-radiologists-planning.html

ну и до кучи, может, кому пригодится: How to Research http://www.dbebooks.biz/ebooks/nonfiction/9243-how-to-research.html
    Вопрос от коллеги ( не может найти ответа на американских форумах). Как SPSS.17 справляется с ОЧЕНЬ БОЛЬШИМИ массивами данных: Миллион строчек, 100 переменных? Сколько памяти  (RAM) нужно программе? Коллега пытается обрабатывать данные на SAS и только подвешивает компьютер (или анализ занимает буквально часы). 
    Можете посоветовать наиболее эффективный способ ускорить работу? Добавить память? Использовать другую программу? Сменить компьютер с 32 на 64 ? Или перейти на Unix (с Windows)? (Решения могут пыть платными. Контора платит - лишь бы знать, что нужно сделать)

Новая версия

  • 31 Май, 2009 at 7:04 PM
4 июня можно будет скачать новую, восемнадцатую, версию SPSS... пардон, это уже называется PASW. Посмотрим, посмотрим, чего там корпорация монстров изготовила. Хотя после перехода на джаву любовь к данному продукту у меня постепенно проходит, тем паче что R мне нравится все больше. Как остановился на 15 версии, так пока только из интереса поглядываю на очередные релизы. Скачал для пробы SDK джавы, чтобы самому попробавть что-то изготовить

28 Май, 2009

  • 2:25 PM
В который раз спаисбо за предыдущие ответы. А можно ли на SPSS посчитать разницу между значениями переменной в двух последовательных строках? Тот же файл:

UserID   var    Date
1              12       Jan-01-2005
1              13       Feb-01-2005
1              20       March-01-2005
2              10       March-10-2005
2              15       March-15-2005

Мне нужно для каждого пользователя подсчитать сколько дней прошло с момент последний транзакции. То есть в результате будет так:

UserID   var         Date                                  period
1              12       Jan-01-2005                        0
1              13       Feb-01-2005                       30
1              20       March-01-2005                   28
2              10       March-10-2005                    0
2              15       March-15-2005                    5

Каким образом в SPSS можно запомнить "предыдущее" число? Спасибо заранее.

Господа, помогите, пожалуйста! Задача, кажется, элементарная, но у меня никакого опыта в этом синтаксисе. Мне нужно создать переменную "номер транзакции" для каждого пользователя.
Есть файл вида:

 UserID Var
1             10
1             20
1             25
2             23
2            15

Нужно создать переменную "счетчик:

UserID Var    Count
1             10       1  
1             20       2
1             25       3
2             23       1
2            15        2

Я попробовала: 

* подсчет количества транзакций для каждого индивида

AGGREGATE
 /OUTFILE=* MODE=ADDVARIABLES OVERWRITE = YES
  /BREAK=UserID
  /pcnumstake=N(Stake).

compute ind = 0.
EXECUTE.

* цикл
loop #j = 1 to pcnumstake.
   COMPUTE ind = #j.
   XSAVE OUTFILE = "c:\temp\tempdata.sav"
  /KEEP UserID ind .
  end loop.
EXECUTE.

Но получаю файл, в котором все повторяется:

UserID   ind
1              1
1              2
1              3
1              1
1              2
1              3
1              1
1              2
1              3
2              1
2              2
2              1
2              2

To, да не то. А как надо?
Спасибо заранее
Нет, ну как такое возможно?! Выпустили 17-ю версию, а нормального руководства к ней НЕТ! И что делать не-гениям математики типа меня?! По аналогии с предыдущими версиями не получается, потому что некоторые функции там вообще изменены.
Теперь, блин, и 15-16 версию не найти (куда не ткнешься, везде: "А зачем? Есть же уже новая!"), и по новой нормального описания нет!:(
Я не довольна! :(

Tags:

Добрый день.
После многочасовых копаний в данных,  я осознал, что сам с этой проблемой справиться не могу, надеюсь, кто-нибудь поможет.
Есть смешанная модель с одним межгрупповым фактором и двумя внутригрупповыми факторами. Измеряется время реакции у испытуемых в трех разных группах (2 эксп. (18+19 чел), 1 контр. (16 чел)) на разные объекты (композитные буквы - буквы, составленные из других букв). Объекты могут быть 4 размеров (внутригрупповой фактор 1 ) и двух типов (локальные/глобальные цели, внутригрупповой фактор 2 ). Также два вида букв, но этот фактор не интересен. Всего 96 проб на человека: 4 размера * 2 типа * 2 вида букв * 3 серии. Порядок предъявления внутри серии случайный - внутригрупповые факторы предъявляются в случайном порядке.

Вопрос: как описать эту модель в R/SPSS и посмотреть post-hoc тесты?
Дальше еще много глупых вопросов. )
Анализирую данные эксперимента по соц психологии.
Сделала множественную регрессию с 15 независимыми переменными. Значимыми оказались только две. Анализирую данные дальше, уже исходя из этих двух независимых переменных.
Одна из них - исходный уровень знаний участников эксперимента.

Интересующая меня зависимость наблюдается только когда уровень знаний изначально низкий (это я определила разбив сплитом респондентов по уровню знаний и сделав регрессию на каждую группу).
Но мой профессор хочет от меня другого, сплит файл он не хочет :)
А именно: какой-то анализ в рамках множественной без прямой разбивки по группам. ПРи этом, нужно получить три разных коэффициента регрессии для каждой области уровня знаний свой (среднее, минус СД, плюс СД). Причем, они почему-то должны линейно возрастать.

Как это сделать, есть идеи?
Прошu совета. У меня накопилось столько вопросов, что кажется, пора задать один глобальный вопрос. Я работаю с данными, записанными в форме: 

UserID TransactionDate   Sum
1             2005-03-04            25
1             2005-04-06            40
1             2005-08-16            10
2
2

Из них мне нужно создавать разные переменные, записанные в стандартном виде, когда на каждой строчке один UserID. Например:

1. Коэффициент регрессии для каждого человека : сумма от времени
2. Коэффициент регрессии для каждого человека : частота тразакций в неделю, месяц или день от времени
3. Число случаев выше 2 стандартных откланений для каждого человека.

Вероятно будет еще много подобного. Я так понимаю, что работая на SPSS можно писать на языке Python, и это даст бесконечные возможности для создания собственных функций (я вообще, программирую на Java и Php, так что с языками программирования знакома.) Имеет ли это смысл? Правильный ли это подход? Или надо пытаться решать каждую такую задачу отдельно? Есть ли какой-нибудь более или менее стандартный подход к таким файлам, и где о нем можно прочитать? 

Profile

ru_spss
[info]ru_spss
Сообщество пользователей SPSS

Реклама

Latest Month

Июль 2009
Вс Пн Вт Ср Чт Пт Сб
   1234
567891011
12131415161718
19202122232425
262728293031 

Tags

Syndicate

RSS Atom
Разработано LiveJournal.com
Designed by [info]chasethestars