На основе данных полученных в результате опроса, средствами программы SPSS, необходимо составить портрет потребителя.
Опрос состоял из 16-ти вопросов, на которые предлагалось выбрать тот или иной вариант ответа.
Вопросы примерно следующего содержания:
1.Ваш пол
1.М 2.Ж
2. Возраст
1.20-30 2. 31-40 3. 41-50
3.Гражданство
1.РФ 2.СНГ 3.Другое
На выходе (после анализа в SPSS) результаты должны быть следующими: наиболее типичным потребителем является - мужчина в возрасте от 31 до 40 лет, гражданин РФ и т.д…
Попыталась использовать факторный и кластерный анализ, но результаты группируются по вопросам, а не по вариантам ответов.
Что делать? Какой метод использовать?
помню, что через regression работала коробочная диаграмма, но кто - нибудь знает как её задать там?
- Mood:
drained
Спасибо всем еще раз за помощь. Я хотела обратиться с вопросом по поводу иерархического кластерного анализа. Попытка провести такой анализ выдает "Недостаточно памяти для кластера". У меня примерно 48000 строчек, и я для пробы ввожу всего одну интервальную переменную. Если в методе я помечаю "стандартизовать", то получаю в ответ :"Ошибка 63. Не находится файл spssclus.tmp" Что за файл, откуда взялся?
Update: Поняла, поняла! Больше так не буду! К-means работает прекрасно. Я, просто, переживала, что выбор k получается вроде как произвольным. Но я учту про использование нескольких меньших выборок. Спасибо всем.
Господа, такой вопрос по Multilayer Perception.
Когда я запускаю Multilayer Perception с n-ным количеством независимых переменных (covariates) то на выходе получаю всегда модель ровно с этим количеством переменных. Я когда-то работала с Weka. Так она выдавала конечную модель только из "нужных" переменных - сама выбирала, какие "важные", а какие нет. (Пример то же, что делает Stepwise метод в линейной регрессии.) В SPSS нет такой опции, или я не могу ее найти? Я нашла опцию "Independent variable importance ". Тогда выдается таблица, где напротив каждой переменной значение ее "важности" от 0 до 100%. Но это не полноценная замена. Кроме того я не вижу, какой процент ошибки в тест и в training по отдельности. Подскажите, пожалуйста.
Есть фактор А - главный фактор. Есть факторы Б, В, Г.
Можно ли сказать, что факторы Б,В,Г детерминируют фактор А? Если нет, то какой статистический метод можно применить для проверки гипотезы о влиянии факторов Б,В,Г на фактор А?
З.Ы. Сложившиеся факторы как по ортогональному, так и не по ортогональному решению сходны..
По совету
Возможно ли такое? И если да, то как это сделать?
Спрашиваю потому, что в директории SPSS отдельной папки под это дело не обнаружил.
Заранее благодарю.
1) Как можно (если можно) ускорить работу OMS?
2) Есть ли способ записать в файл коэффициенты регрессии или кривой с помощью SAVE, а не ОМS?
Мой код на всякий случай.
SORT CASES BY UserID.
SPLIT FILE LAYERED BY UserID.
OMS /DESTINATION VIEWER=NO /TAG='suppressall'.
DATASET DECLARE regressioncoeff.
OMS /SELECT TABLES
/IF COMMANDS=['curvefit'] SUBTYPES=['Model Summary and Parameter Estimates']
/DESTINATION FORMAT=SAV numbered = "TN" OUTFILE='regressioncoeff'
/columns sequence = [l1 r2].
TSET NEWVAR=NONE.
CURVEFIT
/VARIABLES=target WITH Count
/CONSTANT
/MODEL=LINEAR LOGARITHMIC QUADRATIC.
OMSEND.
Информация о компьютере:
Процессор: Intel(R) 2.ooGhz
Скорость процессора: 1.95Ghz
RAM 2048MB
Microsoft Windows XP Professional
Итак, из опросника в 73 вопроса сложилось 8 факторов, которые можно условно разграничить по 3 категориям - факторы коммуникативного, когнитивного и эмоционального блока (именно такая структура закладывалась в типологии). Естественно, если некоторые факторы получились очень "комфортными" (с хорошими нагрузками, полные), то те, которым дисперсии "не осталось" *улыбка*, отвоевали себе не 10 вопросов, как закладывалось в опробационной модели, а по 3-5 вопросов. (Вообще, уважаемый мною товарищ Куликов на Питерской конференции говорил, что в факторной структуре следует учитывать только первые 2-3 фактора, и что Кеттелл - странный товарищ *улыбка*).
В связи с этим.. Можно ли продолжать разработку опросника по блокам, беря 2-3 фактора, сложившиеся в предварительном исследовании? Хочу сейчас взять когнитивный блок, расширить количество пунктов в "шкалах" до 20, провести повторную факторизацию. При подтверждении факторной структуры, валидизировать и верифицировать отдельно когнитивный блок методики?
Спасибо.
Есть ли какой-то софт, для автоматического построения оных?
Уважаемые коллеги !
Просим Вас отреагировать на событие, произошедшее с нашим коллегой из Тюмени, кандидатом социологических наук, Грошевым Игорем Львовичем.
В ходе своего исследования, Игорь Львович провел опрос курсантов Тюменского юридического Института МВД. По результатам опроса им была написана статья, не понравившаяся начальнику Института, поскольку курсанты в своих ответах писали о взятках и других нарушениях, с которыми они сталкивались во время обучения. В итоге, администрация обвинила социолога в нанесении ущерба деловой репутации Института, а суд, в свою очередь , признал иск справедливым.
На сайте Российского Общества Социологов размещено открытое письмо президента РОС Валерия Андреевича Мансурова по делу И. Л. Грошева. http://www.ssa-rss.ru/index.php?page_id=5
Уже поступают первые отклики. В приложении Вы найдете отклик д.ю.н., профессора Гилинского Я. И.
Очень ждем Вашего ответа.
С уважением, секретариат РОС
Аналитическая записка по пилотному проекту.doc (1024 КБ)
ЗАКЛЮЧЕНИЕ экспертной комиссии РОС.doc (32 КБ)
Заявление И. Л. Грошева прокурору Тюменской области.do (46 КБ)
письмо профессора Гилинского.doc (23 КБ)
прошу пеарить = помогает
Confirmatory Factor Analysis (Pocket Guides to Social Work Research Methods) http://www.dbebooks.biz/ebooks/nonficti
Power Analysis for Experimental Research: A Practical Guide for the Biological, Medical and Social Sciences http://www.dbebooks.biz/2007/08/09/powe
Regression Methods in Biostatistics: Linear, Logistic, Survival, and Repeated Measures Models
http://www.dbebooks.biz/ebooks/medi
Biostatistics for Radiologists: Planning, Performing, and Writing a Radiologic Study http://www.dbebooks.biz/ebooks/medi
ну и до кучи, может, кому пригодится: How to Research http://www.dbebooks.biz/ebooks/nonficti
Можете посоветовать наиболее эффективный способ ускорить работу? Добавить память? Использовать другую программу? Сменить компьютер с 32 на 64 ? Или перейти на Unix (с Windows)? (Решения могут пыть платными. Контора платит - лишь бы знать, что нужно сделать)
UserID var Date
1 12 Jan-01-2005
1 13 Feb-01-2005
1 20 March-01-2005
2 10 March-10-2005
2 15 March-15-2005
Мне нужно для каждого пользователя подсчитать сколько дней прошло с момент последний транзакции. То есть в результате будет так:
UserID var Date period
1 12 Jan-01-2005 0
1 13 Feb-01-2005 30
1 20 March-01-2005
2 10 March-10-2005 0
2 15 March-15-2005 5
Каким образом в SPSS можно запомнить "предыдущее" число? Спасибо заранее.
Господа, помогите, пожалуйста! Задача, кажется, элементарная, но у меня никакого опыта в этом синтаксисе. Мне нужно создать переменную "номер транзакции" для каждого пользователя.
Есть файл вида:
UserID Var
1 10
1 20
1 25
2 23
2 15
Нужно создать переменную "счетчик:
UserID Var Count
1 10 1
1 20 2
1 25 3
2 23 1
2 15 2
Я попробовала:
* подсчет количества транзакций для каждого индивида
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES OVERWRITE = YES
/BREAK=UserID
/pcnumstake=N(Stake).
compute ind = 0.
EXECUTE.
* цикл
loop #j = 1 to pcnumstake.
COMPUTE ind = #j.
XSAVE OUTFILE = "c:\temp\tempdata.sav"
/KEEP UserID ind .
end loop.
EXECUTE.
Но получаю файл, в котором все повторяется:
UserID ind
1 1
1 2
1 3
1 1
1 2
1 3
1 1
1 2
1 3
2 1
2 2
2 1
2 2
Спасибо заранее
Теперь, блин, и 15-16 версию не найти (куда не ткнешься, везде: "А зачем? Есть же уже новая!"), и по новой нормального описания нет!:(
Я не довольна! :(
- Mood:
angry
После многочасовых копаний в данных, я осознал, что сам с этой проблемой справиться не могу, надеюсь, кто-нибудь поможет.
Есть смешанная модель с одним межгрупповым фактором и двумя внутригрупповыми факторами. Измеряется время реакции у испытуемых в трех разных группах (2 эксп. (18+19 чел), 1 контр. (16 чел)) на разные объекты (композитные буквы - буквы, составленные из других букв). Объекты могут быть 4 размеров (внутригрупповой фактор 1 ) и двух типов (локальные/глобальные цели, внутригрупповой фактор 2 ). Также два вида букв, но этот фактор не интересен. Всего 96 проб на человека: 4 размера * 2 типа * 2 вида букв * 3 серии. Порядок предъявления внутри серии случайный - внутригрупповые факторы предъявляются в случайном порядке.
Вопрос: как описать эту модель в R/SPSS и посмотреть post-hoc тесты?
( Дальше еще много глупых вопросов. )
Сделала множественную регрессию с 15 независимыми переменными. Значимыми оказались только две. Анализирую данные дальше, уже исходя из этих двух независимых переменных.
Одна из них - исходный уровень знаний участников эксперимента.
Интересующая меня зависимость наблюдается только когда уровень знаний изначально низкий (это я определила разбив сплитом респондентов по уровню знаний и сделав регрессию на каждую группу).
Но мой профессор хочет от меня другого, сплит файл он не хочет :)
А именно: какой-то анализ в рамках множественной без прямой разбивки по группам. ПРи этом, нужно получить три разных коэффициента регрессии для каждой области уровня знаний свой (среднее, минус СД, плюс СД). Причем, они почему-то должны линейно возрастать.
Как это сделать, есть идеи?
UserID TransactionDate Sum
1 2005-03-04 25
1 2005-04-06 40
1 2005-08-16 10
2
2
Из них мне нужно создавать разные переменные, записанные в стандартном виде, когда на каждой строчке один UserID. Например:
1. Коэффициент регрессии для каждого человека : сумма от времени
2. Коэффициент регрессии для каждого человека : частота тразакций в неделю, месяц или день от времени
3. Число случаев выше 2 стандартных откланений для каждого человека.
Вероятно будет еще много подобного. Я так понимаю, что работая на SPSS можно писать на языке Python, и это даст бесконечные возможности для создания собственных функций (я вообще, программирую на Java и Php, так что с языками программирования знакома.) Имеет ли это смысл? Правильный ли это подход? Или надо пытаться решать каждую такую задачу отдельно? Есть ли какой-нибудь более или менее стандартный подход к таким файлам, и где о нем можно прочитать?
