Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Для поступающих (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=113)
-   -   Выбор будущей темы для 05.13.11 Математическое и программное обеспечение (http://www.aspirantura.spb.ru/forum/showthread.php?t=9483)

Meganerd 07.04.2012 13:35

Выбор будущей темы для 05.13.11 Математическое и программное обеспечение
 
При поступлении в аспирантуру хочу выбрать Специальность 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей.
Душа больше лежит к интеллектуальным системам и базам данных.

Моя задача найти точку входа в эту область и углубиться в неё.

Было бы супер найти людей этой же специальности и поработать вмести с ними в качестве ассистента.

Я пока студент. Москва.

ubcent 07.04.2012 17:25

Meganerd, Я тоже студент пока еще) Занимаюсь примерно тем же. Рекомендую обратить внимание в сторону data-minig - это очень наукоемкая отрасль, почти наверняка найдете что-то для себя.

Megabotan 07.04.2012 21:15

Цитата:

Сообщение от ubcent (Сообщение 234541)
Meganerd, Я тоже студент пока еще) Занимаюсь примерно тем же. Рекомендую обратить внимание в сторону data-minig - это очень наукоемкая отрасль, почти наверняка найдете что-то для себя.

Уже обратил. Data Mining - это очень здорово, самая крутая тема в IT и т. д. и т. п.

Вот книги, которые я прочитал почти целиком:
Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. - Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP
Сегаран Т. - Программируем коллективный разум


Но нужна конкретика. Пробовал мучить преподов - безрезультатно.
Выпускающая кафедра не занимается подобными исследованиями.

А у меня пока только размышления (цитирую свой пост с другого форума):

Диплом я хочу выполнить как научно-исследовательскую работу (НИР). Насколько я знаю, такой тип работы предполагает публикацию статьи в научном журнале.

С областью я в целом определился: интеллектуальный анализ данных (т. е. Data Mining), организация данных.
Можно и шире: построение современных интеллектуальных систем.

Из применений Data Mining, которые мне интересны:
анализ неструктурированных данных (текст, возможно мультимедиа - в контексте распознавания / классификации визуальных и звуковых образов),
способы упорядочивания неструктурированных данных (придания структуры),
адаптация / улучшение имеющихся методом Data Mining,
применения интеллектуального анализа данных в Web 2.0 (т. е. оперирование с пользовательским контентом), Semantic Web.
Visual Mining (например, проецирование многомерного представления данных на двумерную плоскость).

С основными методами Data Mining я ознакомился по книгам:
Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. - Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP
Сегаран Т. - Программируем коллективный разум

Буду рад советам по выбору литературы.

И если это будет иметь значение, при определении темы диплома:
есть опыт работы веб-программистом (server side): C#, Microsoft SQL. Т. е. проблем с написанием запросов SQL возникнуть не должно.

Была у меня идея, которая у меня появилась благодаря моему опыту работы системным администратором (т. к. не редки просьбы от директоров предоставить им статистику по работе сотрудников за ПК):
«Система слежения за производительностью сотрудника» (т. е. строиться суточный график работы сотрудника за ПК – к каким документам он обращался, файловые операции, набранные на клавиатуре слова, движения мышью, открытые приложения и т. п.). Собирается статистика всех действий сотрудника за рабочим компьютером, и к этой статистике применяются методы Data Mining.
На компьютере сотрудника устанавливается системная служба – агент. Без пользовательского интерфейса. А, допустим, на компьютере начальника – само приложение, анализирующие статистику. Связь между программой-агентом и приложением осуществляется по TCP. Агент работает как СЕРВЕР, приложение начальника как клиент (запрашивает данные у агента).
Статистика будет собираться с помощью драйверов-фильтров: например, драйвер файловой системы, драйвер клавиатуры. Можно использовать хуки.
Можно сделать вариант системы без начальника, т. е. работник получает подсказки от системы как оптимизировать своё рабочее время, может просматривать историю своих действий за сутки, за месяц. Это, кстати, может пригодиться любому пользователю.
Предполагается реализация системы только в среде Windows, т. к. в офисах всегда стоят системы Windows (не встречал, чтобы было по-другому).

Но на рынке уже присутствуют программы вроде StaffCop, Active Spy и прочие Spy.


Касаемо мультимедиа: в этой области для меня всё совсем непонятно (распознавание визуальных и звуковых образов).
Сейчас я смотрю в сторону методов анализа данных в биологии, химии.

Кто бы мне идейку подкинул...

ubcent 07.04.2012 22:17

Megabotan, идеи - всегда самое сложное=) Конкретную идею Вам вряд ли кто-то подкинет. Покопайтесь в зарубежных источниках, лично у меня идея родилась почти сразу после начала изучения литературы по сабжу.

avz 09.04.2012 11:04

>>> Была у меня идея, которая у меня появилась благодаря моему опыту работы системным администратором

Это хороший диплом по ИВТ или АСОиУ, но вряд ли может быть развернуто в диссертацию, тем более, по 11й.

techni 09.04.2012 12:29

К сожалению поздновато заметил данную тему, но на будущее настоятельно рекомендую попробовать свои силы в Google Summer of Code: https://www.google-melange.com/gsoc/.../gsoc2012/faqs
заодно и незаменимый для 05.13.11 язык подтяните :)

Megabotan 09.04.2012 17:44

Цитата:

Сообщение от avz (Сообщение 234808)
>>> Была у меня идея, которая у меня появилась благодаря моему опыту работы системным администратором

Это хороший диплом по ИВТ или АСОиУ, но вряд ли может быть развернуто в диссертацию, тем более, по 11й.

А для диплома — 230201 "Информационные системы и технологии"
это тема подходит?

Megabotan 09.04.2012 19:47

Цитата:

Сообщение от techni (Сообщение 234833)
заодно и незаменимый для 05.13.11 язык подтяните :)

Python? ;)

Добавлено через 5 минут
Только не говорите, что Вы имели ввиду C++... :eek:

techni 09.04.2012 19:51

Цитата:

Сообщение от Megabotan (Сообщение 234943)
Python? ;)

Окститесь, юноша :D
Если уж терпеть синтаксически-зачимую индентацию, то в чём-нибудь типа Haskell ;)

avz 09.04.2012 21:48

Конечно. Только я бы какое-то управление или поддержку принятия решений сделал на основе получаемой с компов пользователей информации

Amok 10.04.2012 20:26

Направление, в принципе, хорошее. И диссертации я похожие видел, например, в Стэндфорде. Только вряд ли она у вас хорошо пойдет. Тут нужно лопатить много англоязычной литературы и, желательно, содействие научника. С 90 процентной вероятностью вашему научнику эта тема будет неинтересна.
У меня знакомый недавно бросил аспирантуру с темой анализа User Experience и создание новых поколенийи интерфейсов ОС, его элементарно никто на кафедре не понимал. Хотя стажировался этот парень в американских вузах и даже какую-то небольшую стипендию от них под это получал, если мне не изменяет память.
Ну и самое главное, у вас есть направление, но нет конкретных научных проблем в этой области. Сделайте обзор литературы. Сформулируйте их.

kravets 10.04.2012 20:33

Цитата:

Сообщение от Amok (Сообщение 235277)
У меня знакомый недавно бросил аспирантуру с темой анализа User Experience и создание новых поколенийи интерфейсов ОС, его элементарно никто на кафедре не понимал.

Предложите знакомому связаться со мной. Глядишь, и закончит исследование.

ubcent 10.04.2012 20:37

Amok, Вы хотите сказать, что Data-mining у нас плохо идет? Я просто пытаюсь в этом направлении работать и поступать собираюсь с этим же направлением.

Amok 10.04.2012 20:49

В качестве простой идеи для диплома.

Сделайте статистический анализ переходов на сайте. Определите функции полезности ( минимизация пути достижения узла графа, максимизация вероятности покупки и т.д.) - можно для различных категорий сайтов. Накопите статистику. Сделайте на сайте блоки для меню. Отрейтенгуйте позиции в них. Сделайте заполнение меню динамическим на основе функций полезности. Можно выявлять по характеру посещений какие-то паттерны и ранжировать ссылки в блоке навигации.
Там можете и применить знания из "Программируем коллективный разум".- протестировать разные алгоритмы ранжирования.

Добавлено через 5 минут
Цитата:

Сообщение от ubcent (Сообщение 235281)
Amok, Вы хотите сказать, что Data-mining у нас плохо идет? Я просто пытаюсь в этом направлении работать и поступать собираюсь с этим же направлением.

Великолепно идет. Hadoop, HBase, MapReduce - очень модное направление. Вопрос в проблемах. Ваш научник должен понимать в том, что вы делаете хотя бы чуть-чуть. Я, например, забил на диссер, когда меня начали на кафедере спрашивать во время доклада почему я говорю пакеты в сетях. Откуда значит такой странный термин, пакет. Наверное, это я ошибся.
Ну и дальше пошло: локальность обращений - фундаментальная вещь, у нас про нее никто не слышал. Есть смысл на каждый термин выслушивать, что я ошибся и в какой-то теории так называются совсем другие вещи. Генетические алгоритмы? Молодой человек, что за термин "генетические". Вы что на биологии что ли. Сам, конечно, дебил - надо было аккуратно выбирать кафедру.

ubcent 10.04.2012 20:56

Цитата:

Сообщение от Amok (Сообщение 235282)
Великолепно идет. Hadoop, HBase, MapReduce - очень модное направление. Вопрос в проблемах. Ваш научник должен понимать в том, что вы делаете хотя бы чуть-чуть. Я, например, забил на диссер, когда меня начали на кафедере спрашивать во время доклада почему я говорю пакеты в сетях. Откуда значит такой странный термин, пакет. Наверное, это я ошибся.
Ну и дальше пошло: локальность обращений - фундаментальная вещь, у нас про нее никто не слышал. Есть смысл на каждый термин выслушивать, что я ошибся и в какой-то теории так называются совсем другие вещи. Генетические алгоритмы? Молодой человек, что за термин "генетические". Вы что на биологии что ли.

А Вы если не секрет чем занимаетесь? В какой степи применяли генетические алгоритмы? Меня очень интересует все что связано с анализом текстовой информации, веб-контента и пр. На данный момент пишу диплом на тему интеллектуальной классификации контента. Как считаете пойдет в качестве базы для дальнейшей работы?


Текущее время: 05:08. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»