مقاله رایگان با موضوع داده‌های، عصبی، حفاری، می‌شود.

دانلود پایان نامه

پارامترهای تأثیرگذار می‌باشد. پارامترهای استفاده شده در این مدل‌سازی، اطلاعات حاصل از گزارش‌های روزانه دکل‌های حفاری در میدان مارون در سال‌های 81 تا 85 می‌باشند. از میان 1756 مجموعه داده (ورودی و خروجی) بعد از آنالیز داده‌ها، 1630 مجموعه داده مربوط به 38 حلقه چاه در مدل‌سازی استفاده شد. بعضی از پارامترهای موثر به صورت غیر مستقیم از پارامترهای دکل حفاری بدست می‌آیند. این پارامترها را می‌توان از فرمول‌های زیر محاسبه کرد.
نرخ نفوذ :
(4-4)

طول حفره باز :
(4-5)

فشار گل :
(4-6)

ویسکوزیته پلاستیک و نقطه تسلیم :
(4-7)

(4-8)

حجم آنالوس :
(4-9)

در این فرمول‌ها ROP نرخ نفوذ بر حسب فوت بر ساعت، h متراژ حفاری بر حسب فوت، t زمان بر حسب ساعت، طول حفره باز بر حسب فوت، D عمق حفاری بر حسب فوت، عمق لوله جداری بر حسب فوت، فشار گل بر حسب فوت بر اینچ مربع، MW وزن گل بر حسب پوند بر گالن، نیروی برشی در سرعت 600 دور در ثانیه، نیروی برشی در سرعت 300 دور در ثانیه، قطر مته بر حسب فوت، قطر بیرونی لوله حفاری می‌باشد.
برای در نظر گرفتن نوع سازند و زیر بخش‌های آن‌ها، به جای استفاده از نام آن‌ها، از کدهای عددی استفاده شد تا برای شبکه عصبی قابل فهم شود. آنالیز آماری و محدوده پارامترهای استفاده شده در مدل‌سازی، در جدول 4-3 لیست شده‌اند.
جدول 4-3 آنالیز آماری داده های استفاده شده در مدل‌سازی هرزروی سیال حفاری
پارامتر
واحد
Min.
Max.
St.Dev
Median
Average
Q (1)
Q (2)
Q (3)
E

1887105
1935965
5/14834
1905439
1909394
1897105
1905439
1920921
N

1005701
1054298
8/13876
1028773
1028816
1015000
1028773
1040088
D
Ft
752
5662
5/796
5/3063
3072
2554
5/3063
5/3619
For.Top
Ft
52/5
1296800
129574
07/10005
80673
3254
07/10005
7/78901
For

09/0
08/48
8/1
31/2
6/2
32/1
3/2
4/3

5
125
5/38
9/15
43
45/15
9/15
70
ROP
Ft/hr

4858
1045
2934
2688
2312
2934
3345

GPM
80
1000
4/234
510
13/525
3
510
650

Psi
100
2950
895
2310
7/1959
1150
2310
2800

Psi
6/431
22859
6/7221
8/12084
11399
6/3993
8/12084
18782
MFVis
Cp

100
9/10
47
76/48
40
47
56
S
%

61
32/16
23
95/25
12
23
43
PV
Cp

130
7/27
25
9/36
14
25
57
YP


105
9/6
14
5/14
10
14
19
INTGL


30
63/2
3
85/3
2
3
5
Min10GL


35
95/2
5
3/5
3
5
7
Loss
Bbl

1875
6/160
64
2/111
20
64
140

4-3-1-4- گیر لوله حفاری
برای داشتن مدلی جامع و فراگیر در پیش‌بینی و تعیین نوع گیر رشته حفاری، نیاز به در نظر گرفتن کلیه پارامترهای تأثیرگذار می‌باشد. از میان 950 مجموعه داده (ورودی و خروجی) بعد از آنالیز داده‌ها، 874 مجموعه داده مربوط به 33 حلقه چاه در مدل‌سازی استفاده شد. از این تعداد 86 مورد نشان دهنده گیر لوله بوده‌اند.
برای این بخش نرخ نفوذ، طول حفره باز، فشار گل، ویسکوزیته پلاستیک و نقطه تسلیم از فرمول‌های قبلی محاسبه می‌شوند. قطر آنالوس با فرمول زیر محاسبه می‌شود :
(4-10)

در این بخش نیز نام سازند را با کدهای عددی نشان داده‌ایم و همچنین گیر لوله حفاری را با عدد صفر برای داده‌های غیر گیر، عدد 5/0 برای داده‌های گیر مکانیکی و عدد 1 را برای داده‌های گیر اختلاف فشاری نشان داده‌ایم. محدوده پارامترهای به کار برده شده در جدول 4-4 لیست شده‌اند.

4-3-2- پیش‌پردازش داده‌ها
در این مرحله، داده‌های جمع آوری شده از میدان، مورد بررسی و آنالیز قرار گرفته و آماده ورود به برنامه می‌شوند. این مرحله از اهمیت به سزایی برخوردار است. بر این اساس دو عمل مهم باید انجام گردد:
4-3-2-1- آنالیز داده‌ها و تأیید صحت و دقت آن‌ها
در این مرحله با بررسی دقیق تک تک داده‌ها مشکلات آن‌ها اعم از داده‌های بی‌مقدار و داده‌های خارج از محدوده را برطرف می‌کنیم. در مورد داده‌های بی‌مقدار چند تکنیک می‌توان استفاده کرد. اول اینکه می‌توان آن داده‌ها را به کلی حذف کرد و یا اینکه میانگینی از مقادیر داده قبل و بعد را محاسبه کرده و آن را لحاظ کنیم. داده‌های خارج از محدوده نیز می‌توان از طریق نمودارهای ستونی که در نرم افزار وکا85 موجود می‌باشند کمک گرفت و آنها را پیدا کرد و از مجموعه داده‌ها حذف کرد.

جدول 4-4 آنالیز آماری داده های استفاده شده در مدل‌سازی گیر لوله حفاری
پارامتر
واحد
Min.
Max.
St.Dev
Median
Average
Q (1)
Q (2)
Q (3)
E

1887105
1935965
53/13437
1915702
7/1912543
1900439
1915702
1921140
N

1005701
1054298
63/13806
1023859
5/1025933
1013070
1023859
1036403
D
Ft
164
17388
82/3890
03/9137
78/9049
96/6226
03/9137
34/12073
ROP
Ft/hr

58/173
64/14
7
18/10
28/3
7
3/12
F

10
95
33/26
26
36
15
26
65

Ft
64/1
8989
44/2827
85/2486
3/3427
87/944
85/2486
61/5790

In
75/4
25/16
29/0
3/0
4/0
2/0
31/0
54/2
WOB
1000b

80
25/13
25
25
18
25
30

Ft/hr

208
26/50
79
74
37
79
105

Psi
5/23
7/4523
37/1024
4/1661
1/1844
53/1174
4/1661
69/2456
M.F.Vis
Cp

100
33/14
45
44
35
45
54
Salt
PPM

490000
15/126633
320000
281334
280000
32000

343250
S
%

62
48/15
18
3/21
8
18
35
PV
Cp

120
51/25
20
28
7
20
40
YP
lb/100ft2

105
4/8
13
14
9
13
18
INGL
lb/100ft2

18
92/2
4
4
2
4
6
Min.10GL
lb/100ft2

22
35/3
5
6
4
5
8

Ft
30
925
75/231
174
263
58/88
88/173
1/410
RPM
Rpm

200
07/62
150
24/120
70
150
170
Stuck


1
34/0




4-3-2-2- همسان‌سازی داده‌ها
برای جلوگیری از بروز مشکل پراکندگی و قرار گرفتن تمام داده‌ها در یک بازه مشخص، معمولاً داده‌های ورودی قبل از انتقال به شبکه با استفاده از رابطه ذیل در بازه صفر و یک محدود می‌شوند.
(4-11)

که در آن i از یک تا m تغییر می‌کند. همچنین در این رابطه، بیشترین و کمترین مقدار x خواهد بود.

4-3-3- تقسیم‌بندی داده‌ها
بعد از جمع‌آوری و پردازش کامل داده‌ها، نوبت به کار با شبکه عصبی می‌رسد. به طور کلی داده‌های ورودی به شبکه‌های عصبی به سه بخش ذیل تقسیم می‌گردند:
– مجموعه داده‌های آموزش: از این مجموعه داده، برای ساخت شبکه عصبی استفاده می‌شود.
– مجموعه داده‌های اعتبارسنجی: در حین ساخت شبکه با داده‌های آموزش، ممکن است شبکه برای دستیابی به عملکرد بهتر مقادیر پارامتر هدف را حفظ کرده (به خاطر بسپارد) و خروجی خود را نزدیک به داده‌های واقعی کند. برای جلوگیری از پیش آمدن چنین اتفاقی، یک قسمت از داده‌ها را با عنوان داده‌های اعتبار سنجی مشخص می‌کنیم که پس از آموزش شبکه در هر مرحله، شبکه با این دادها تست می‌شود، تا میزان واقعی بودن خروجی شبکه مشخص شود و در صورت فراهم شدن شرط پایان (مناسب بودن میزان دقت شبکه) آموزش شبکه به پایان برسد.
– مجموعه داده‌های تست: پس از آن که شبکه توسط داده‌های آموزش تا رسیدن به حداقل خطا آموزش یافت، مابقی داده‌ها که در آموزش و اعتبارسنجی نقشی نداشته‌اند به عنوان ورودی به شبکه داده‌شده و پاسخ شبکه با پاسخ مطلوب مقایسه می‌گردد و بدین ترتیب راندمان شبکه آموزش دیده، محک زده می‌شود.
در این بخش، مهم‌ترین مسئله چگونگی انتخاب مجموعه داده‌های مربوط به سه بخش یاد شده است. در بیشتر شبکه‌های عصبی معمولاً از 70 درصد داده‌ها برای آموزش، 15 درصد برای اعتبارسنجی و 15 درصد باقیمانده براى تست شبکه استفاده می‌شوند. به طور کلی روش تقسیم این داده‌ها به یک دید خوب تحلیلی از چگونگی عملکرد شبکه و توزیع مناسب داده‌های هر چاه در هر کدام از مجموعه داده‌ها نیاز دارد. یکی از نکته‌های کلیدی و بسیار مهم در تقسیم‌بندی داده‌ها این است که مقادیر ماکزیمم و مینیمم هر پارامتر حتماً در مجموعه داده‌های آموزش قرار گیرند. در بخش مقاومت فشاری، داده‌ها به سه بخش 60، 15 و 25 درصد به ترتیب برای آموزش، اعتبار سنجی و تست شبکه تقسیم شدند. برای مدل‌سازی انتخاب مته و نرخ نفوذ، 70 درصد داده‌ها برای آموزش، 15 درصد برای اعتبارسنجی و 15 درصد باقیمانده نیز برای تست شبکه به کار برده شدند. در بخش سوم، 60 درصد داده‌ها برای آموزش، 20 درصد برای اعتبارسنجی و 20 درصد باقیمانده نیز برای تست شبکه به کار برده شدند و در بخش چهارم، 60 درصد داده‌ها برای آموزش، 15 درصد برای اعتبارسنجی و 25 درصد باقیمانده نیز برای تست شبکه به کار برده شدند. با تقسیم‌بندی داده‌ها به سه گروه اصلی، کار با برنامه آغاز می‌گردد.

این مطلب مشابه را هم بخوانید :   تصدیق، پیام، دریافت، الکترونیکی

4-4- مدل کردن
پس از انجام مراحل قبل، داده‌ها برای مدل‌سازی آماده هستند. در این مرحله شبکه عصبی مناسب با توجه به مزیت‌ها و معایب آن‌ و هدف ما از انجام کار انتخاب می‌شود. در این مرحله نوع شبکه عصبی، ساختار و اجزاء آن انتخاب می‌شود. پس از انتخاب شبکه مورد نظر باید ساختار آن از جمله تعداد لایه‌های مخفی و تعداد نرون آن مشخص شود. همچنین شرط پایان مرحله آموزش نیز برای شبکه در این مرحله تعیین می‌شود. در این بخش از شبکه‌های عصبی مصنوعی و الگوریتم‌های بهینه سازی برای ایجاد مدل مناسب استفاده می‌کنیم.

4-5- معیارهای عملکرد
جهت بررسی عملکرد مدل‌ها و مقایسه نتایج، معیارهایی لازم است تا در تحقیق مورد استفاده قرار گیرد که از بین معیارهای مرسوم از ضریب رگرسیون86 ()، ضریب تعیین87 () و میانگین مربع خطا88 (MSE) استفاده گردید. مقدار بیانگر ارتباط بین داده‌های واقعی و مدل بوده که مقدار آن بین منفی یک تا یک است؛ که مقدار منفی یک نشان دهنده رابطه معکوس و رابطه یک نشان دهنده رابطه مستقیم و مقدار صفر نشان دهنده عدم وجود رابطه بین داده‌ها می‌باشد. مقدار این متغیر از رابطه (4-12) بدست می‌آید. مقدار ضریب رگرسیون به توان دو است. در صورتی که اختلاف زیادی بین داده‌های واقعی و مدل وجود داشته باشد، معیار ضریب رگرسیون به تنهایی نمی‌تواند بیانگر رابطه قوی بین داده‌ها باشد. بنابراین از معیار دیگری که بیانگر وضعیت اختلاف بین داده‌های واقعی و مدل است، استفاده می‌شود. بدین منظور معیار MSE مورد استفاده قرار گرفت. هر چه مقدار این معیار کمتر باشد نشان از دقت بالاتر مدل است. مقدار MSE به کمک رابطه (4-13) محاسبه می‌شود.

(4-12)

در معادله فوق و هر یک از داده‌ها و و میانگین کل داده‌های پیش‌بینی شده و واقعی می‌باشند.

(4-13)

که در این فرمول مقدار خروجی شبکه برای بردار داده i ام، مقدار واقعی داده برای بردار داده i ام و n تعداد کل داده های در دسترس است.

فصل پنجم: آنالیز و تحلی
ل اطلاعات

5-1- مقدمه
همان‌طور که بیان شد هدف این پروژه بهبود انتخاب مته و نرخ نفوذ حفاری، تعیین مقاومت فشاری تک محوره سنگ سازند، پیش‌بینی و کاهش هرزروی سیال حفاری و پیش‌بینی و کاهش احتمال گیر لوله حفاری می‌باشد. در این فصل به کمک روش‌های هوش مصنوعی بیان شده در فصل 3 و داده‌های تصحیح شده در فصل 4، مدل‌سازی برای دستیابی به هدف مورد نظر انجام می‌شود و نتایج برای بیان وضعیت مدل ارائه می‌شود.

5-2- مقاومت فشاری تک محوره سنگ سازند
برای پیش‌بینی مقاومت فشاری تک محوره سنگ سازند دو مدل را توسعه دادیم. مدل شبکه عصبی پرسپترون چند لایه و مدل شبکه عصبی پرسپترون بهینه شده توسط الگوریتم ژنتیک، و نتایج هر دو مدل را از لحاظ دقت و زمان محاسبات مورد بررسی قرار داده و بهترین مدل را برای استفاده در عملیات حفاری آینده انتخاب کردیم. از آنجایی که بهترین مدل‌سازی‌ انجام شده در این بخش توسط شبکه عصبی پرسپترون انجام شد، در این بخش سعی شده عملکرد این شبکه مورد بررسی قرار گرفته و برای افزایش کارایی آن پیشنهاداتی ارائه گردد.

5-2-1- روش کار
5-2-1-1- پیش‌بینی UCS توسط MLP
پرسپترون چندلایه یکی از شایع‌ترین شبکه‌های عصبی مصنوعی پیشخور است که با استفاده از روش شرح داده‌ شده در فصل 3، ورودی‌ها را به خروجی مرتبط می‌کند. معمولاً، لایه‌های داخلی پرسپترون چندلایه به طور کامل با یکدیگر متصل می‌شوند.
از آنجا که، در این مطالعه ما می‌خواهیم شبکه‌های عصبی مصنوعی را به عنوان یک مسئله بهینه‌سازی نگاه کنیم، بنابراین، بهتر است به معرفی پیچیدگی یادگیری آن پرداخت. معمولاً، خطا در شبکه عصبی با معیارهای مختلف اندازه گیری می‌شود. یکی از این معیارها میانگین مربع خطا است، که طبق فرمول (4-12) برابر است با:
(4-12)

همان‌طور که گفته شد، وزن‌ها در شبکه عصبی به منظور کاهش خطا و افزایش سازگاری تغییر می‌یابند. بنابراین، با استفاده از گرادیان نزولی، تغییرات در وزن به این صورت است:

(5-1)

که در آن خروجی نرون قبلی و نرخ یادگیری است که تغییرات در وزن و همگرایی را کنترل می‌کند. به عنوان مثال، با استفاده از یک مقدار زیاد سرعت یادگیری، منجر می‌شود که عملکرد الگوریتم بسیار سریع شود، اما ممکن است در منیمم محلی به دام افتد. در حالی که، انتخاب مقدار کوچک برای این متغیر می‌تواند باعث عملکرد آهسته الگوریتم شود و زمان محاسبات را افزایش دهد. تغییرات خطا بسته به حوزه محلی ناشی می‌شود. بنابراین، می‌توان مشتق آن را برای یک گره خروجی به صورت زیر نوشت:

(5-2)

که در آن مشتق تابع فعال‌سازی است. بدیهی است، که بسیاری از پارامترها به همدیگر بستگی دارند و در نتیجه نشان دادن همه معادله را سخت می‌کند. برای مثال، مشتق مرتبط هست:

(5-3)

روشن است که وابستگی در وزن‌های جدید و قبلی وجود دارد، بنابراین، برای پیدا کردن وزن جدید در لایه پنهان، وزن قبلی بر طبق مشتق تابع فعال تغییر می‌کند به همین دلیل به این الگوریتم پس انتشار می‌گویند [73].
با توجه به شکل 3-3 و فرمول‌های فوق، روشن است که یک بار محاسباتی بزرگ در شبکه عصبی وجود دارد. بنابراین، به احتمال بسیار زیاد شبکه در کمینه محلی به دام می‌افتد به خصوص اگر داده‌های زیادی خطا داشته باشند و از الگوریتم‌های یادگیری محلی استفاده شود.
به همین دلیل، می‌توان برای کاهش بار محاسباتی و تعیین مقادیر مناسب متغیرها (وزن‌ها و

دیدگاهتان را بنویسید